-
大小: 1KB文件類型: .py金幣: 1下載: 1 次發(fā)布日期: 2021-06-05
- 語言: Python
- 標(biāo)簽:
資源簡介
python_爬取網(wǎng)上資源存入數(shù)據(jù)庫中
輕松實現(xiàn)小爬蟲
關(guān)鍵:絕對能跑的代碼
代碼片段和文件信息
#?_*_?coding:utf-8?_*_
from?urllib?import?request
from?bs4?import?BeautifulSoup??#爬蟲的一種插件,自己下載
import?pymysql
db_config?={
????‘host‘:‘XX.XX.XX.XX‘ #數(shù)據(jù)庫服務(wù)器IP地址
????‘port‘:3306 #數(shù)據(jù)庫服務(wù)器端口號,一般是3306
????‘user‘:‘root‘ #數(shù)據(jù)庫用戶名
????‘password‘:‘xxxx‘ #數(shù)據(jù)庫密碼
????‘db‘:‘test_spider‘ #數(shù)據(jù)庫表名稱
????‘charset‘:‘utf8‘ #數(shù)據(jù)字符類型
}
connection?=?pymysql.connect(**db_config)
url?=?r‘http://www.jianshu.com/‘
headers?=?{‘User-Agent‘:‘Mozilla/5.0?(Windows?NT?10.0;?WOW64)?AppleWebKit/537.36?(KHTML?like?Gecko)?Chrome/55
評論
共有 條評論