Webbots, Spiders, and Screen Scrapers (Paperback)
暫譯: 網路機器人、蜘蛛程式與螢幕擷取工具 (平裝本)

Michael Schrenk

買這商品的人也買了...

相關主題

商品描述

Description

The Internet is bigger and better than what a mere browser allows. Webbots, Spiders, and Screen Scrapers is for programmers and businesspeople who want to take full advantage of the vast resources available on the Web. There's no reason to let browsers limit your online experienceespecially when you can easily automate online tasks to suit your individual needs.

Learn how to write webbots and spiders that do all this and more:

  • Programmatically download entire websites
  • Effectively parse data from web pages
  • Manage cookies
  • Decode encrypted files
  • Automate form submissions
  • Send and receive email
  • Send SMS alerts to your cell phone
  • Unlock password-protected websites
  • Automatically bid in online auctions
  • Exchange data with FTP and NNTP servers

Sample projects using standard code libraries reinforce these new skills. You'll learn how to create your own webbots and spiders that track online prices, aggregate different data sources into a single web page, and archive the online data you just can't live without. You'll learn inside information from an experienced webbot developer on how and when to write stealthy webbots that mimic human behavior, tips for developing fault-tolerant designs, and various methods for launching and scheduling webbots. You'll also get advice on how to write webbots and spiders that respect website owner property rights, plus techniques for shielding websites from unwanted robots. Some tasks are just too tediousor too important!?to leave to humans. Once you've automated your online life, you'll never let a browser limit the way you use the Internet again.

 

Table of Contents

Introduction

PART I: FUNDAMENTAL CONCEPTS AND TECHNIQUES
Chapter 1: What's in It for You?
Chapter 2: Ideas for Webbots
Chapter 3: Downloading Web Pages
Chapter 4: Parsing Techniques
Chapter 5: Automating Form Submission
Chapter 6: Managing Large Amounts of Data

PART II: PROJECTS
Chapter 7: Price-Monitoring Webbots
Chapter 8: Image-Capturing Webbots
Chapter 9: Link-Verification Webbots
Chapter 10: Anonymous Browsing Webbots
Chapter 11: Search-Ranking Webbots
Chapter 12: Aggregation Webbots
Chapter 13: FTP Webbots
Chapter 14: NNTP News Webbots
Chapter 15: Webbots That Read Email
Chapter 16: Webbots That Send Email
Chapter 17: Converting a Website into a Function

PART III: ADVANCED TECHNICAL CONSIDERATIONS
Chapter 18: Spiders
Chapter 19: Procurement Webbots and Snipers
Chapter 20: Webbots and Cryptography
Chapter 21: Authentication
Chapter 22: Advanced Cookie Management
Chapter 23: Scheduling Webbots and Spiders

PART IV: LARGER CONSIDERATIONS
Chapter 24: Designing Stealthy Webbots and Spiders
Chapter 25: Writing Fault-Tolerant Webbots
Chapter 26: Designing Webbot-Friendly Websites
Chapter 27: Killing Spiders
Chapter 28: Keeping Webbots out of Trouble
Appendix A: PHP/CURL Reference
Appendix B: Status Codes
Appendix C: SMS Email Addresses
Index

 

商品描述(中文翻譯)

**描述**

網際網路的資源遠比單純的瀏覽器所能提供的要大得多且更為豐富。《Webbots, Spiders, and Screen Scrapers》是為那些希望充分利用網路上龐大資源的程式設計師和商業人士而寫的。沒有理由讓瀏覽器限制你的線上體驗,尤其是當你可以輕鬆自動化線上任務以滿足個人需求時。

學習如何編寫能夠完成這些任務的網路機器人和爬蟲:

- 程式化下載整個網站
- 有效解析網頁中的數據
- 管理 cookies
- 解碼加密文件
- 自動提交表單
- 發送和接收電子郵件
- 向手機發送 SMS 警報
- 解鎖受密碼保護的網站
- 自動在網上拍賣中出價
- 與 FTP 和 NNTP 伺服器交換數據

使用標準代碼庫的示例專案將加強這些新技能。你將學會如何創建自己的網路機器人和爬蟲,追蹤線上價格,將不同的數據來源聚合到單一網頁中,並存檔你無法生活的線上數據。你將從一位經驗豐富的網路機器人開發者那裡獲得內部資訊,了解如何以及何時編寫模仿人類行為的隱形網路機器人,開發容錯設計的技巧,以及啟動和排程網路機器人的各種方法。你還將獲得如何編寫尊重網站擁有者財產權的網路機器人和爬蟲的建議,以及保護網站免受不必要機器人侵擾的技術。有些任務實在是太繁瑣或太重要,無法交給人類來完成!一旦你自動化了你的線上生活,你將不會再讓瀏覽器限制你使用網際網路的方式。

**目錄**

引言

第一部分:基本概念與技術
第1章:這對你有什麼好處?
第2章:網路機器人的想法
第3章:下載網頁
第4章:解析技術
第5章:自動提交表單
第6章:管理大量數據

第二部分:專案
第7章:價格監控網路機器人
第8章:圖像捕捉網路機器人
第9章:鏈接驗證網路機器人
第10章:匿名瀏覽網路機器人
第11章:搜尋排名網路機器人
第12章:聚合網路機器人
第13章:FTP 網路機器人
第14章:NNTP 新聞網路機器人
第15章:讀取電子郵件的網路機器人
第16章:發送電子郵件的網路機器人
第17章:將網站轉換為函數

第三部分:進階技術考量
第18章:爬蟲
第19章:採購網路機器人和狙擊手
第20章:網路機器人與密碼學
第21章:身份驗證
第22章:進階 cookie 管理
第23章:排程網路機器人和爬蟲

第四部分:更大的考量
第24章:設計隱形網路機器人和爬蟲
第25章:編寫容錯網路機器人
第26章:設計友好的網站給網路機器人
第27章:消滅爬蟲
第28章:讓網路機器人避免麻煩
附錄 A:PHP/CURL 參考
附錄 B:狀態碼
附錄 C:SMS 電子郵件地址
索引