資源簡介
本書講解了如何使用P川lOil來編寫網絡爬蟲程序, 內容包括網絡爬蟲簡介, 從頁面中抓取數據的三種方法, 提取緩存中 的數據, 使用多個線程和進程來進行并發抓取, 如何抓取動態頁面中 的內容, 與表單進行交互 , 處理頁面中的驗證碼問題, 以及使用 Sca rpy和 Portia 來進行數據抓取, 并在最后使 用本書介紹的數據抓取技術對幾個真實的網站進行了抓取, 旨在幫助讀者活學活用書中介紹的技術 。
代碼片段和文件信息
- 上一篇:與孩子一起學編程(中文完整版)
- 下一篇:Python核心編程第二版本
評論
共有 條評論