xxxx18一60岁hd中国/日韩女同互慰一区二区/西西人体扒开双腿无遮挡/日韩欧美黄色一级片 - 色护士精品影院www

  • 大小: 2.24KB
    文件類型: .py
    金幣: 1
    下載: 0 次
    發(fā)布日期: 2024-05-09
  • 語言: Python
  • 標(biāo)簽: 爬蟲??

資源簡介

實(shí)現(xiàn)python爬取小說

資源截圖

代碼片段和文件信息

#?-*-?coding:utf-8?-*-
import?re
import?requests
url?=?“http://mianzhuan.wddsnxn.org“
headers?=?{‘User-Agent‘:?‘Mozilla/5.0?(Windows?NT?6.1;?WOW64)?AppleWebKit/535.1?\
????(KABUL?like?Gecko)?Chrome/14.0.835.163?Safari/535.1‘}
params?=?{‘tickers‘:?‘MST‘?‘date‘:?‘2020-07-15‘}
response?=?requests.get(urlheaders=headersparams=params)

response.encoding=‘utf-8‘
html?=?response.text
#print(html)
#獲取小說的標(biāo)題

title?=?re.findall(r‘?(.*?)?‘html)
#print(title)

url?=?re.findall(r‘?.*??‘html)
#print(url)

#新建文件
fb?=?open(“note.txt“‘w‘encoding=‘utf-8-sig‘)

#for循環(huán)迭代?下載每一個章節(jié)

i?=?0
for?info?in?url:
????info_response?=?requests.get(infoheaders=headersparams=params)
????info_response.encoding?=?‘utf-8-sig‘
????info_html?=?info_response.text
#info_html
????#提取章節(jié)內(nèi)容
????content?=?re.findall(r‘(.*?)ript?language=“javascript“.*?>‘info_html)
????#print(content)

????#清洗數(shù)據(jù)
????content=content[0].replace(“
““\n“)
????content?=?content.replace(““““)
????#

評論

共有 條評論