xxxx18一60岁hd中国/日韩女同互慰一区二区/西西人体扒开双腿无遮挡/日韩欧美黄色一级片 - 色护士精品影院www

  • 大小: 1.76KB
    文件類型: .py
    金幣: 1
    下載: 0 次
    發布日期: 2021-01-30
  • 語言: Python
  • 標簽: 爬取??小說??

資源簡介

Python爬取小說網站

資源截圖

代碼片段和文件信息

import?requests
import?pymysql
from?lxml?import?etree
import?os

#?設計模式?--?面向對象?繼承、封裝
class?Spider(object):

????def?start_request(self):
????????#?1.?請求網站拿到HTML源代碼,抽取小說名、小說鏈接?創建文件夾
????????response?=?requests.get(“https://www.qidian.com/all“)
????????html?=?etree.HTML(response.text)???#?lxml?中的?etree?來解析?HTML
????????Bigtit_list?=?html.xpath(‘//div[@class=“book-mid-info“]/h4/a/text()‘)
????????Bigsrc_list?=?html.xpath(‘//div[@class=“book-mid-info“]/h4/a/@href‘)
????????for?Bigtit?Bigsrc?in?zip(Bigtit_list?Bigsrc_list):
????????????if?os.path.exists(Bigtit)?==?False:
????????????????os.mkdir(Bigtit)
????????????self.file_data(Bigtit?Bigsrc)

????def?file_data(self?Bigtit?Bigsrc):
????????#?2.?請求小說拿到HTML源代碼,抽取章名、章鏈接
????????response?=?requests.get(“http:“?+?Bigsrc)

評論

共有 條評論