關(guān)于我們
書單推薦
新書推薦

網(wǎng)絡(luò)爬蟲技術(shù)

網(wǎng)絡(luò)爬蟲技術(shù)

定  價:50 元

        

  • 作者:吳月萍主編
  • 出版時間:2023/11/1
  • ISBN:9787576331578
  • 出 版 社:北京理工大學(xué)出版社
  • 中圖法分類:TP311.561 
  • 頁碼:199頁
  • 紙張:
  • 版次:1
  • 開本:26cm
9
7
3
8
3
7
1
5
5
7
7
6
8

讀者對象:軟件工具程序設(shè)計人員

本書內(nèi)容主要包含6部分,第1部分認識網(wǎng)頁的構(gòu)造及爬蟲的原理,第2部分實現(xiàn)靜態(tài)網(wǎng)頁的爬取,第3部分實現(xiàn)數(shù)據(jù)存儲到文件、數(shù)據(jù)庫,第4部分實現(xiàn)動態(tài)網(wǎng)頁的爬取,第5部分針對不同反爬限制技術(shù)實現(xiàn)數(shù)據(jù)爬取,第6部分使用Scrapy爬蟲框架進行爬取。內(nèi)容較好地涵蓋了企業(yè)爬蟲崗位所需要掌握得requests、httpx、BeautifulSoup、lxml、parsel、Selenium等第三方庫及正則,數(shù)據(jù)的文本、CSV、JSON文件存儲,MySQL、MongoDB數(shù)據(jù)庫存儲,中間件集成中的Redis、Kafka等使用,Scrapy框架以及解決如圖片驗證碼、賬號限制、IP限制等問題。本書以企業(yè)級的項目為主線進行講解,每個部分通過“項目-任務(wù)-案例”展開,對所需的知識點進行全面的介紹,并給出了任務(wù)實現(xiàn)的詳細操作步驟和相應(yīng)的實戰(zhàn)練習(xí)題。全書由淺入深、實例生動、易學(xué)易用,可以滿足不同層次讀者的需求。
 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內(nèi)容