資源簡介
【實例簡介】
主要功能模塊及界面(截圖)
代碼的入口是
它首先是讓用戶輸入書名,調用了下載模塊
調用下載模塊后會獲得到小說的URL和小說名字,程序把獲得小說的網址調用給獲取章節(jié)模塊
調用獲取章節(jié)模塊后會獲得到小說的URL,得到小說的URL后,把傳過來的URL的頁面內容進行解析,把小說的章節(jié)個解析獲取下了。并把傳輸顯示和寫入模塊,進行每一個章節(jié)的URL內容解析,把每章的內容給循環(huán)取出,寫入到TXT文本里面,而且還顯示當前寫入的章節(jié)名和爬取網站的總進度。
代碼片段和文件信息
import?requests
import?re
import?time
import?random
def?download(book_name):
????#?下載模塊
????search_real_url?=?‘https://www.biquge5200.com/modules/article/search.php?searchkey=‘?+?book_name
????try:
????????novel_source?=?requests.get(search_real_url).text
????????reg1?=?r‘(.*?) .*?(.*?) ‘
????????#?所有搜索到的結果(包括小說網址、名稱、作者姓名)
????????novel_list?=?re.findall(reg1?novel_source?re.S)
????????#?判斷是否有數據返回
????????if?len(novel_list)?==?0:
????????????print(‘搜索不到你要的小說‘)
????except?Exception?as?e:
????????print(e)
????for?novel_url?novel_name?novel_author?in?novel_list:
????????if?novel_name?==?book_name:
????????????print(‘書名:%s?作者:%s‘?%?(novel_name?novel_author))
????????????return?novel_url?novel_name
def?get_chapter(url):
????#?獲取章節(jié)頁面模塊
????try:
????????#?章節(jié)頁面源代碼
????????chapter_page_source?=?requests.get(url).text
????????reg2?=?r‘(.*?) ‘
????????chapter_list?=?re.fi
- 上一篇:唐僧大戰(zhàn)白骨精(源碼)
- 下一篇:python核心編程第二版-習題答案
評論
共有 條評論