爬蟲逆向進階實戰
李璽 著
- 出版商: 機械工業
- 出版日期: 2022-05-01
- 售價: $834
- 貴賓價: 9.5 折 $792
- 語言: 簡體中文
- 頁數: 362
- 裝訂: 平裝
- ISBN: 7111704525
- ISBN-13: 9787111704522
-
相關分類:
Web-crawler 網路爬蟲
立即出貨
買這商品的人也買了...
-
$780$663 -
$780$616 -
$1,000$850 -
$403網絡輿情分析技術
-
$588$559 -
$534$507 -
$714$678 -
$301反爬蟲 AST 原理與還原混淆實戰 (微課視頻版)
-
$594$564 -
$750$592 -
$580$458 -
$839$797 -
$480$379 -
$653Python 網絡爬蟲技術手冊:基礎·實戰·強化
-
$654$621 -
$607網絡攻防:技術、工具與實踐 (原書第3版)
-
$680$537 -
$599$569 -
$556雲原生開發實踐
-
$880$748 -
$653機器學習和深度學習:原理、算法、實戰 (使用 Python 和 TensorFlow)
-
$680$530 -
$550$539 -
$450$405 -
$480$379
商品描述
本書以爬蟲逆向方向的相關技術和崗位要求進行撰寫,
總結了爬蟲的架構體系、主流框架和未來發展ꎮ 書中包括各種自動化工具、抓包工具、逆向工具的使用,
核心內容以Web Js 逆向、安卓逆向、小程序逆向為主。
結合三十多個實戰案例進行分析,內容從易到難,循序漸進,
另外還對主流的反爬蟲技術進行了講解,包括傳輸協議、驗證碼體系、字符集映射、行為和指紋等。
本書適合對爬蟲逆向感興趣,想進一步提升自我的程序員參考閱讀。
作者簡介
李璽
就職於中科大數據研究院。
深耕爬蟲逆向方向,擁有豐富的經驗和精湛的技巧。
作者是CSDN博客專家,爬蟲逆向社區站長,
曾榮獲CSDN首屆GEEK+原創大賽一等獎、2019-2021年博客之星。
擁有爬蟲領域發明專利,新工科大數據技術能力認證,
也是河南省中原科技城E類人才。
作者在CSDN、51CTO、OSCHINA(開源中國)、思否、
微信公眾號等平臺都有推文,閱讀量超百萬,並維護著爬蟲逆向萬人社區
目錄大綱
前言
第1章 網絡爬蟲架構
1.1 爬蟲發展史
1.2 爬蟲基本架構
1.3 分佈式爬蟲架構
1.3.1 主從分佈式
1.3.2 對等分佈式
1.4 網絡爬蟲遍歷策略
1.4.1 廣度優先策略
1.4.2 深度優先策略
1.4.3 最佳優先策略
1.5 智能採集系統架構
1.5.1 採集需求分類
1.5.2 頁面智能解析
1.5.3 數據管理模塊
第2章 Python爬蟲技巧
2.1 Utils
2.1.1 爬蟲工具包
2.1.2 智能解析庫
2.2 Scrapy
2.2.1 Scrapy架構
2.2.2 Scrapy信號
2.2.3 Scrapy異常
2.2.4 Scrapy去重
2.2.5 Scrapy部署
2.2.6 Scrapy監控
2.3 Asyncpy
2.3.1 Asyncpy架構
2.3.2 Asyncpy安裝
2.3.3 Asyncpy使用
2.4 Feapder
2.4.1 Feapder架構
2.4.2 Feapder使用
2.4.3 Feapder部署
2.5 ScrapyRedis
2.5.1 運行原理
2.5.2 源碼解析
2.5.3 集群模式
2.6 Scrapy開發
2.6.1 Scrapy_helper
2.6.2 Webmagicx
2.7 Crawlab
2.7.1 Crawlab架構
2.7.2 Crawlab部署
2.8 代理IP工具
2.8.1 Proxy_pool
2.8.2 PyproxyAsync
第3章 Web Js逆向
3.1 逆向基礎
3.1.1 語法基礎
3.1.2 作用域
3.1.3 窗口對象屬性
3.1.4 事件
3.2 瀏覽器控制台
3.2.1 Network
3.2.2 Sources
3.2.3 Application
3.2.4 Console
3.3 加密參數定位方法
3.3.1 巧用搜索
3.3.2 堆棧調試
3.3.3 控制台調試
3.3.4 監聽XHR
3.3.5 事件監聽
3.3.6 添加代碼片
3.3.7 註入和Hook
3.3.8 內存漫遊
爬蟲逆向進階實戰
3.4 常見的壓縮和混淆
3.4.1 webpack
3.4.2 eval混淆
3.4.3 aa和jj混淆
3.4.4 Jsfuck混淆
3.4.5 OLLVM混淆
3.4.6 soJson加密
3.4.7 lsb隱寫
3.5 常見的編碼和加密
3.5.1 base64
3.5.2 MD5
3.5.3 SHA1
3.5.4 HMAC
3.5.5 DES
3.5.6 AES
3.5.7 RSA
3.6 加密參數還原與模擬
3.6.1 Virustotal逆向入門案例
3.6.2 Newrank榜單逆向案例
3.6.3 MD5加密逆向案例
3.6.4 RSA參數加密逆向案例
3.6.5 AES數據加密逆向案例
3.6.6 AES鏈接加密逆向案例
3.6.7 CNVD加速樂分析案例
3.7 瀏覽器環境補充
3.7.1 常被檢測的環境
3.7.2 手動補充環境
3.7.3 JSDOM環境補充
3.7.4 Selenium環境模擬
3.7.5 puppeteer環境模擬
3.8 瀏覽器環境監測
3.8.1 Proxyintercept
3.8.2 Objecthook
3.9 加密方法遠程調用
3.9.1 微博登錄參數RPC
3.9.2 抖音直播數據RPC
3.9.3 巨量指數簽名RPC
3.10 常見協議分析
3.10.1 webSocket協議
3.10.2 Protobuf協議
3.11 常見反調試
3.11.1 無限Debugger
3.11.2 無法打開控制台
3.11.3 禁用控制台輸出
3.11.4 蜜罐和內存爆破
3.11.5 控制台狀態檢測
3.12 調試工具補充
3.12.1 WTJS調試工具
3.12.2 發條JS調試工具
3.12.3 鬼鬼JS調試工具
3.13 反混淆AST
3.13.1 節點類型對照表
3.13.2 節點屬性和方法
3.13.3 拆解簡單ob混淆
3.13.4 用AST還原代碼
第4章 自動化工具的應用
4.1 Selenium
4.1.1 工具簡介
4.1.2 基本操作
4.1.3 調用JavaScript
4.1.4 採集案例
4.1.5 檢測應對
4.2 Pyppeteer
4.2.1 工具簡介
4.2.2 使用方法
4.2.3 檢測應對
4.2.4 攔截器
4.3 cefPython3
4.3.1 安裝和使用
4.3.2 瀏覽器配置
4.3.3 客戶端控制
4.3.4 文檔解析
4.3.5 爬蟲實戰
4.4 Playwright
4.4.1 工具安裝
4.4.2 基本使用
4.4.3 異步任務
4.4.4 自動錄制
4.5 Appnium
4.5.1 Appnium概念
4.5.2 Appnium配置
4.5.3 Appnium測試
4.6 Airtest
4.6.1 設備連接
4.6.2 窗口介紹
4.6.3 簡單測試
4.7 Auto.js
4.7.1 工具簡介
4.7.2 使用案例
4.7.3 指數查詢案例
第5章 抓包工具的應用
5.1 Fiddler
5.1.1 Fiddler配置
5.1.2 Fiddler斷點
5.1.3 Fiddler接口調試
5.1.4 Fiddler替換Js文件
5.1.5 Fiddler保存響應內容
5.1.6 Fiddler監聽webSocket
5.2 Charles
5.2.1 Charles配置
5.2.2 Charles斷點
5.2.3 Charles保存響應內容
5.2.4 Charles監聽webSocket
5.3 MitmProxy
5.3.1 工具介紹
5.3.2 安裝配置
5.3.3