關(guān)于我們
書單推薦
新書推薦

大數(shù)據(jù)導(dǎo)論 思維、技術(shù)與應(yīng)用

大數(shù)據(jù)導(dǎo)論 思維、技術(shù)與應(yīng)用

定  價(jià):49.8 元

        

  • 作者:武志學(xué)
  • 出版時(shí)間:2019/4/1
  • ISBN:9787115504852
  • 出 版 社:人民郵電出版社
  • 中圖法分類:TP274 
  • 頁(yè)碼:244
  • 紙張:
  • 版次:01
  • 開本:16開
9
7
5
8
0
7
4
1
8
1
5
5
2
本書將基本概念與實(shí)例相結(jié)合,由淺入深、循序漸進(jìn)地對(duì)大數(shù)據(jù)思維、技術(shù)和應(yīng)用做了全面系統(tǒng)的介紹。全書共12章,分為大數(shù)據(jù)基礎(chǔ)篇、大數(shù)據(jù)存儲(chǔ)篇、大數(shù)據(jù)處理篇、大數(shù)據(jù)挖掘篇和大數(shù)據(jù)應(yīng)用篇。 大數(shù)據(jù)基礎(chǔ)篇的內(nèi)容涵蓋了大數(shù)據(jù)思維理念、大數(shù)據(jù)的產(chǎn)生與作用、大數(shù)據(jù)基本概念、大數(shù)據(jù)采集工具Flume和Scribe、大數(shù)據(jù)爬蟲工具Nutch和Scapy、大數(shù)據(jù)預(yù)處理工具Kettle、大數(shù)據(jù)處理架構(gòu)Hadoop;大數(shù)據(jù)存儲(chǔ)篇的內(nèi)容包含分布式文件存儲(chǔ)系統(tǒng)HDFS、海量數(shù)據(jù)存儲(chǔ)數(shù)據(jù)庫(kù)系統(tǒng)HBase和海量數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)Hive;大數(shù)據(jù)處理篇主要介紹了分布式并發(fā)計(jì)算批處理模式MapReduce,基于內(nèi)存的快速處理模式Spark,以及基于實(shí)時(shí)數(shù)據(jù)流的實(shí)時(shí)處理模式Spark Streaming;大數(shù)據(jù)挖掘篇主要對(duì)分類、預(yù)測(cè)、聚類和關(guān)聯(lián)等各類大數(shù)據(jù)挖掘算法的原理和使用場(chǎng)景進(jìn)行了描述,并使用Spark MLlib提供的機(jī)器學(xué)習(xí)算法進(jìn)行了實(shí)例講解;大數(shù)據(jù)應(yīng)用篇分別從大數(shù)據(jù)場(chǎng)景應(yīng)用的橫向和縱向出發(fā),介紹了大數(shù)據(jù)在各個(gè)功能領(lǐng)域的應(yīng)用場(chǎng)景和在各個(gè)行業(yè)的應(yīng)用場(chǎng)景。
 你還可能感興趣
 我要評(píng)論
您的姓名   驗(yàn)證碼: 圖片看不清?點(diǎn)擊重新得到驗(yàn)證碼
留言內(nèi)容