玩轉 Python 網絡爬蟲

黃永祥

  • 出版商: 清華大學
  • 出版日期: 2018-08-01
  • 定價: $414
  • 售價: 8.5$352
  • 語言: 簡體中文
  • 頁數: 311
  • 裝訂: 平裝
  • ISBN: 7302503281
  • ISBN-13: 9787302503286
  • 相關分類: PythonWeb-crawler 網路爬蟲
  • 立即出貨 (庫存 < 3)

買這商品的人也買了...

相關主題

商品描述

本書站在初學者的角度,從原理到實踐,循序漸進地講述了使用Python開發網絡爬蟲的核心技術。全書從邏輯上可分為基礎篇、實戰篇和爬蟲框架篇三部分。基礎篇主要介紹了編寫網絡爬蟲所需的基礎知識,分別是網站分析、數據抓取、數據清洗和數據入庫。網站分析講述如何使用Chrome和Fiddler抓包工具對網絡做全面分析;數據抓取介紹了Python爬蟲模塊Urllib和Requests的基礎知識;數據清洗主要介紹字符串操作、正則和Beautiful Soup的使用;數據入庫分別講述了MySQL和MongoDB的操作,通過ORM框架SQLAlchemy實現數據持久化,實現企業級開發。實戰篇深入講解了分佈式爬蟲、爬蟲軟件開發與應用、12306搶票程序和微博爬取,所舉示例均來自於開發實踐,可幫助讀者快速提升技能,開發實際項目。框架篇主要講述Scrapy的基礎知識,並通過爬取QQ音樂為實例,讓讀者深層次瞭解Scrapy的使用。
本書內容豐富,註重實戰,適用於從零開始學習網絡爬蟲的初學者,或者是已經有一些網絡爬蟲編寫經驗,但希望更加全面、深入理解Python爬蟲的開發人員。

海報: