-
大小: 727KB文件類型: .doc金幣: 1下載: 1 次發(fā)布日期: 2021-07-10
- 語言: Python
- 標(biāo)簽: 網(wǎng)絡(luò)爬蟲??
資源簡介
以世紀(jì)佳緣網(wǎng)為例,思考自己所需要的數(shù)據(jù)資源,并以此為基礎(chǔ)設(shè)計自己的爬蟲程序。應(yīng)用python偽裝成瀏覽器自動登陸世紀(jì)佳緣網(wǎng),加入變量打開多個網(wǎng)頁。通過python的urllib2函數(shù)進(jìn)行世紀(jì)佳緣網(wǎng)源代碼的獲取。用正則表達(dá)式分析源代碼,找到所需信息導(dǎo)入excel。連接數(shù)據(jù)庫,將爬下的數(shù)據(jù)存儲在數(shù)據(jù)庫中。
代碼片段和文件信息
評論
共有 條評論