-
大小: 1.49MB文件類型: .pdf金幣: 1下載: 0 次發(fā)布日期: 2023-10-25
- 語言: Python
- 標(biāo)簽: python??for??information??
資源簡介
本書講解了如何使用python網(wǎng)絡(luò)爬蟲程序,內(nèi)容包括網(wǎng)絡(luò)爬蟲簡介,從頁面抓取數(shù)據(jù)的三種方法,提取緩存中的數(shù)據(jù)。使用多個線程和進(jìn)程進(jìn)行并發(fā)抓取。如何抓取動態(tài)頁面中的內(nèi)容。與表單進(jìn)行交互,處理頁面中的驗(yàn)證碼問題。以及使用scarpy和Portia來來進(jìn)行數(shù)據(jù)抓取,并在最后使用本書介紹的數(shù)據(jù)抓取技術(shù)對幾個真實(shí)的網(wǎng)站進(jìn)行了抓取
代碼片段和文件信息
評論
共有 條評論