玩轉 Python 網絡爬蟲
黃永祥
- 出版商: 清華大學
- 出版日期: 2018-08-01
- 定價: $414
- 售價: 8.5 折 $352
- 語言: 簡體中文
- 頁數: 311
- 裝訂: 平裝
- ISBN: 7302503281
- ISBN-13: 9787302503286
-
相關分類:
Python、Web-crawler 網路爬蟲
立即出貨 (庫存 < 3)
買這商品的人也買了...
-
$590$502 -
$301Python 數據挖掘入門與實踐 (Learning Data Mining with Python)
-
$420$357 -
$500$395 -
$356算法圖解 (Grokking Algorithms: An illustrated guide for programmers and other curious people)
-
$390$308 -
$403Python 爬蟲開發與項目實戰
-
$390$304 -
$490$245 -
$550$468 -
$551HTML + CSS + JavaScript 網頁設計從入門到精通
-
$301從零開始學Python網絡爬蟲
-
$440$374 -
$454TensorFlow 深度學習應用實踐
-
$294$279 -
$250Python 3爬蟲、數據清洗與可視化實戰
-
$500$390 -
$250用 Python 寫網絡爬蟲, 2/e (Python Web Scraping, 2/e)
-
$505蟲術 — Python 絕技
-
$620$484 -
$690$538 -
$834$792 -
$1,000$790 -
$620$484 -
$550$429
相關主題
商品描述
本書站在初學者的角度,從原理到實踐,循序漸進地講述了使用Python開發網絡爬蟲的核心技術。全書從邏輯上可分為基礎篇、實戰篇和爬蟲框架篇三部分。基礎篇主要介紹了編寫網絡爬蟲所需的基礎知識,分別是網站分析、數據抓取、數據清洗和數據入庫。網站分析講述如何使用Chrome和Fiddler抓包工具對網絡做全面分析;數據抓取介紹了Python爬蟲模塊Urllib和Requests的基礎知識;數據清洗主要介紹字符串操作、正則和Beautiful Soup的使用;數據入庫分別講述了MySQL和MongoDB的操作,通過ORM框架SQLAlchemy實現數據持久化,實現企業級開發。實戰篇深入講解了分佈式爬蟲、爬蟲軟件開發與應用、12306搶票程序和微博爬取,所舉示例均來自於開發實踐,可幫助讀者快速提升技能,開發實際項目。框架篇主要講述Scrapy的基礎知識,並通過爬取QQ音樂為實例,讓讀者深層次瞭解Scrapy的使用。
本書內容豐富,註重實戰,適用於從零開始學習網絡爬蟲的初學者,或者是已經有一些網絡爬蟲編寫經驗,但希望更加全面、深入理解Python爬蟲的開發人員。
海報: