xxxx18一60岁hd中国/日韩女同互慰一区二区/西西人体扒开双腿无遮挡/日韩欧美黄色一级片 - 色护士精品影院www

資源簡(jiǎn)介

爬取指定標(biāo)簽List下評(píng)分8.5分以上的圖書信息,包括書名、作者、評(píng)分、簡(jiǎn)介,并保存到excel,以標(biāo)簽分類,放到不同的sheet中。核心代碼: title= book.find_element_by_xpath('.//a[1]').text #獲取書名 zuozhe= book.find_element_by_xpath('.//div[1]').text.split('/',1)[0] jianjie= book.find_element_by_xpath('.//p[1]').text #獲取簡(jiǎn)介 worksheet.write(i,0,fenshu); #分?jǐn)?shù)寫入第i行的第一列 worksheet.write(i,1,title); #書名寫入第i行的第二列 worksheet.write(i,2,zuozhe); #作者寫入第i行的第三列 worksheet.write(i,3,jianjie); #簡(jiǎn)介寫入第i行的第四列

資源截圖

代碼片段和文件信息

#coding:utf-8
from?selenium?import?webdriver?#自動(dòng)化測(cè)試模塊
from?urllib?import?parse?#url過濾特殊字符
import?xlwt?#excel寫入用

self?=?webdriver.Chrome()??#指定selenium進(jìn)行自動(dòng)化操作時(shí)選用谷歌瀏覽器
workbook?=?xlwt.Workbook(encoding?=?‘a(chǎn)scii‘)?#創(chuàng)建workbook
k=0;
fenlei=[?
‘職場(chǎng)‘‘互聯(lián)網(wǎng)‘‘用戶體驗(yàn)‘?
]
try:
for?f?in?fenlei:
print(f)
worksheet?=?workbook.add_sheet(f)?#每各標(biāo)簽創(chuàng)建一個(gè)sheet,sheet名為標(biāo)簽名
i=0;#記錄每個(gè)標(biāo)簽爬取到了多少符合條件的數(shù)據(jù)
j=0;#記錄每個(gè)標(biāo)簽有多少數(shù)據(jù)結(jié)構(gòu)不規(guī)范的數(shù)據(jù)
self.get(‘https://book.douban.com/tag/‘+parse.quote(f)+‘?start=0&type=T‘)??#打開指定標(biāo)簽第一頁(yè)的網(wǎng)頁(yè)
pagesize?=?int(self.find_elements_by_class_name(‘paginator‘)[0].find_element_by_xpath(‘.//a[last()]‘).text)?#獲取該標(biāo)簽下有多少頁(yè)數(shù)據(jù)
if?pagesize>50:?#不知道為什么,每個(gè)標(biāo)簽下,只能瀏覽前50頁(yè)
pagesize=50
for?num?in?range(0pagesize):
self.get(‘https://book.douban.com/tag/‘+parse.quote(f)+‘?start=‘+str(num*20)+‘&type=T‘)?#打開指定標(biāo)簽、指定頁(yè)數(shù)的網(wǎng)頁(yè)
total_book?=?self.find_element_by_id(‘subject_list‘)?#獲得當(dāng)頁(yè)圖書列表所在容器
books?=?total_book.find_elements_by_class_name(‘info‘)???#獲得當(dāng)頁(yè)所有包含單個(gè)圖書信息的容器,返回一個(gè)數(shù)組
for?book?in?books

評(píng)論

共有 條評(píng)論