Python 爬蟲從菜鳥到高手
李寧
- 出版商: 清華大學
- 出版日期: 2023-09-01
- 售價: $714
- 貴賓價: 9.5 折 $678
- 語言: 簡體中文
- 頁數: 460
- 裝訂: 平裝
- ISBN: 7302640513
- ISBN-13: 9787302640516
-
相關分類:
Web-crawler 網路爬蟲
立即出貨 (庫存 < 3)
買這商品的人也買了...
-
$2,120$2,014 -
$301細說網頁製作
-
$480$379 -
$301混沌工程實戰 手把手教你實現系統穩定性
-
$654$621 -
$620$527 -
$414$393 -
$1,200$792 -
$621使用 GitOps 實現 Kubernetes 的持續部署:模式、流程及工具
-
$479$455 -
$680$530 -
$653機器學習項目交付實戰
-
$254Python 網絡爬蟲技術, 2/e (微課版)
-
$980$774 -
$862Django4 實例精解
-
$1,200$792 -
$1,200$948 -
$680$530 -
$594$564 -
$539$512 -
$527Apache Pulsar實戰
-
$490$387 -
$419$398 -
$780$616 -
$654$621
相關主題
商品描述
本書從實戰角度系統論述了Python 爬蟲技術的核心知識,並通過大量的真實項目幫助讀者深入掌握Python 爬蟲技術及其實現。本書提供了大量實戰案例,演繹採用各種技術編寫Python 爬蟲的方式。讀者可以任意組合使用這些技術,完成非常復雜的爬蟲應用。本書共20 章,分為五篇。第一篇:基礎知識(第1~2 章),主要包括Python 編程環境的搭建、IDE 的安裝和使用、HTTP 的基礎知識、網頁基礎(HTML、CSS、JavaScript)、爬蟲的基本原理、Session、Cookie。第二篇:網絡庫(第3~5 章),主要包括網絡庫urllib、urllib3 和requests 的核心使用方法,例如,發送HTTP 請求、處理超時、設置HTTP 請求頭、處理中文字符、搭建和使用代理、解析鏈接、Robots 協議等。第三篇:解析庫(第6~9 章),主要包括3 個常用解析庫(lxml、Beautiful Soup 和pyquery)的使用方法,同時介紹了多種用於分析HTML 代碼的技術,例如,正則表達式、XPath、CSS 選擇器、方法選擇器等。第四篇:數據存儲(第10~11 章),主要包括Python 中數據存儲的解決方案,如文件存儲和SQLite 數據庫。第五篇:爬蟲高級應用(第12~20 章),主要包括Python 爬蟲的一些高級技術,如抓取異步數據、Selenium、Splash、抓取移動App 數據、Appium、多線程爬蟲、爬蟲框架Scrapy、通過OpenCV 技術識別驗證碼;最後給出一個綜合的實戰案例,該案例綜合了Python 爬蟲、數據存儲、PyQt、多線程、數據可視化、Web 等多種技術實現一個可視化爬蟲。