本書覆蓋了當前主流的大數(shù)據(jù)處理領域的熱門技術,包括Hadoop, Spark, Storm, Dremel/Drill等,詳細的分析了各種技術的應用場景和優(yōu)缺點。同時,本書闡述了大數(shù)據(jù)下的日志分析系統(tǒng),重點講解了ELK日志處理方案。最后分析了大數(shù)據(jù)處理技術的發(fā)展趨勢。
本書以幽默大話的表述風格,使讀者容易理解,輕松掌握。重點從各個技術的起源、設計思想、構架方面闡述,幫助讀者能從根源上悟出大數(shù)據(jù)處理之道。
本書適合大數(shù)據(jù)開發(fā)、大數(shù)據(jù)測試人員,以及其他軟件開發(fā)或者管理人員和計算愛好者閱讀。
書名 | 大數(shù)據(jù)處理之道 | 作者 | 何金池 |
---|---|---|---|
ISBN | 9787121287237 | 類別 | 大數(shù)據(jù)技術 |
頁數(shù) | 270 | 定價 | 79.00 |
出版社 | 電子工業(yè)出版社 | 出版時間 | 2016-09-01 |
裝幀 | 平裝 | 開本 | 16 |
大數(shù)據(jù)對企業(yè)產(chǎn)生的一個重要價值就是分析數(shù)據(jù)的質量,此外,企業(yè)內部是否會形成一個個孤立的數(shù)據(jù)孤島,數(shù)據(jù)是否會成就企業(yè)內某些人或團隊新的權力,導致數(shù)據(jù)不能得到實時有效地分享,這些都會是阻礙大數(shù)據(jù)在企業(yè)中有...
如果保存了應該有軸網(wǎng)及框架柱的,你檢查一下是否點到層數(shù)不對,如在二層畫的,打開后軟件直接出現(xiàn)的是一層,所以沒有;另一個可以按柱的快捷鍵“Z”看看是否顯示框架柱,切換樓層看看其它層是否有框架柱。
貴州省大數(shù)據(jù)產(chǎn)業(yè)發(fā)展中心在貴陽市云巖區(qū)大西門北京貴陽大數(shù)據(jù)應用展示中心在貴陽國家高新技術產(chǎn)業(yè)開發(fā)區(qū)西部研發(fā)基地(陽關大道28號)
格式:pdf
大?。?span id="71gi512" class="single-tag-height">26KB
頁數(shù): 3頁
評分: 4.3
大數(shù)據(jù)處理:技術與流程 文章來源: ECP大數(shù)據(jù)時間: 2013/5/22 11:28:34 發(fā)布者: ECP大數(shù)據(jù)( 關注: 848) 標簽: “大數(shù)據(jù)”是需要新處理模式才能具有更強的決策力、 洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海 量、高增長率和多樣化的信息資產(chǎn)。 特點是: 數(shù)據(jù)量大 (Volume) 、數(shù)據(jù)種類多樣 (Variety) 、 要求實時性強 (Velocity) 。對它關注也是因為它蘊藏的商業(yè)價值大 (Value) 。也是大數(shù)據(jù)的 4V特性。符合這些特性的,叫大數(shù)據(jù)。 大數(shù)據(jù)會更多的體現(xiàn)數(shù)據(jù)的價值。 各行業(yè)的數(shù)據(jù)都越來越多, 在大數(shù)據(jù)情況下, 如何保 障業(yè)務的順暢, 有效的管理分析數(shù)據(jù), 能讓領導層做出最有利的決策。 這是關注大數(shù)據(jù)的原 因。也是大數(shù)據(jù)處理技術要解決的問題。 大數(shù)據(jù)處理技術 大數(shù)據(jù)時代 的超大數(shù)據(jù)體量和占相當比例的半結構化和非結構化數(shù)據(jù)的存在, 已經(jīng)超越 了傳統(tǒng)數(shù)據(jù)
格式:pdf
大?。?span id="6m1nfia" class="single-tag-height">26KB
頁數(shù): 2頁
評分: 4.3
數(shù)據(jù)處理流程設計 數(shù)據(jù)處理流程包含數(shù)據(jù)預處理、 統(tǒng)計分析、數(shù)據(jù)挖掘和數(shù)據(jù)質量管理等系列 環(huán)節(jié)。如下圖所示: 圖 1:數(shù)據(jù)處理業(yè)務架構 其中,數(shù)據(jù)預處理是對數(shù)據(jù)集進行抽樣、轉換、合并、刪除、解析等數(shù)據(jù)預 處理工作,主要是對數(shù)據(jù)格式、缺失值、異常值、記錄、字段等進行處理,以便 得到符合后續(xù)業(yè)務應用、 數(shù)據(jù)統(tǒng)計和挖掘所需的高質量數(shù)據(jù)。 數(shù)據(jù)統(tǒng)計和數(shù)據(jù)挖 掘是通過大數(shù)據(jù)挖掘和機器學習模型對海量數(shù)據(jù)進行挖掘和學習, 從而得到潛在 的數(shù)據(jù)知識和規(guī)律。 同時,作為數(shù)據(jù)質量相關的工作標準和規(guī)范的管理, 也貫穿 了整個數(shù)據(jù)處理的過程。 (1)數(shù)據(jù)預處理 為保證入庫數(shù)據(jù)質量和數(shù)據(jù)規(guī)范性, 提高存儲和數(shù)據(jù)訪問效率, 為后續(xù)的統(tǒng) 計分析功能提供數(shù)據(jù)基礎, 我們將數(shù)據(jù)預處理過程分解成數(shù)據(jù)質量校驗、 清洗轉 換、質量提升三個步驟,采用專家知識庫及核心算法庫,利用時間序列、數(shù)據(jù)融 合、內存計算等技術,建立數(shù)據(jù)處理模型,