xxxx18一60岁hd中国/日韩女同互慰一区二区/西西人体扒开双腿无遮挡/日韩欧美黄色一级片 - 色护士精品影院www

  • 大小: 0.10M
    文件類型: .rar
    金幣: 1
    下載: 0 次
    發布日期: 2021-01-30
  • 語言: Python
  • 標簽: 微博??python??采集??

資源簡介

新浪微博信息豐富,適合用來做分析,用Python網絡爬蟲工具進行微博信息的獲取是一種行之有效的方法,(附贈移動端代碼),全親自實踐,希望多多交流,共同學習

資源截圖

代碼片段和文件信息

#?coding=utf-8

“““??
Created?on?2016-01-09?@author:?Eastmount

功能:?爬取新浪微博用戶的信息
信息:用戶ID?用戶名?注冊時間?性別?地址(城市)?是否認證?用戶標簽(明星、搞笑等信息)
????個人資料完成度?粉絲數?關注數?微博數?粉絲ID列表?關注人ID列表?特別關注列表
網址:http://weibo.cn/?數據量更小?相對http://weibo.com/

參考:佳琪學弟和datahref博客?使用Selenium獲取登錄新浪微博的Cookie
java鏈接:http://datahref.com/book/article.php?article=webcollector_WeiboCrawler?
python:http://blog.csdn.net/warrior_zhang/article/details/50198699
“““????

import?time????????????
import?re????????????
import?os????
import?sys??
import?codecs??
import?shutil
import?urllib?
from?selenium?import?webdriver????????
from?selenium.webdriver.common.keys?import?Keys????????
import?selenium.webdriver.support.ui?as?ui????????
from?selenium.webdriver.common.action_chains?import?ActionChains


#先調用無界面瀏覽器PhantomJS或F

?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----

?????文件??????17680??2018-11-13?15:54??[源碼]?爬取移動端微博信息(附贈客戶端代碼)\[源碼]?爬取移動端個人信息?關注id和粉絲id?(速度慢)\SinaWeibo_Info_1.txt

?????文件?????????50??2018-11-13?15:54??[源碼]?爬取移動端微博信息(附贈客戶端代碼)\[源碼]?爬取移動端個人信息?關注id和粉絲id?(速度慢)\SinaWeibo_List_1.txt

?????文件??????14884??2018-11-13?15:54??[源碼]?爬取移動端微博信息(附贈客戶端代碼)\[源碼]?爬取移動端個人信息?關注id和粉絲id?(速度慢)\spider_selenium_sina_info_other_userid_all.py

?????文件??????13386??2018-11-13?15:54??[源碼]?爬取移動端微博信息(附贈客戶端代碼)\[源碼]?爬取移動端微博信息?(強推)\2016-04-23\20160423_SinaWeibo_Num_Best.txt

?????文件???????1595??2018-11-13?15:54??[源碼]?爬取移動端微博信息(附贈客戶端代碼)\[源碼]?爬取移動端微博信息?(強推)\2016-04-23\Megry_Result_Best.py

?????文件?????237289??2018-11-13?15:54??[源碼]?爬取移動端微博信息(附贈客戶端代碼)\[源碼]?爬取移動端微博信息?(強推)\2016-04-23\SinaWeibo_Info_best_1.txt

?????文件????????189??2018-11-13?15:54??[源碼]?爬取移動端微博信息(附贈客戶端代碼)\[源碼]?爬取移動端微博信息?(強推)\2016-04-23\SinaWeibo_List_best_1.txt

?????文件??????12115??2018-11-13?15:54??[源碼]?爬取移動端微博信息(附贈客戶端代碼)\[源碼]?爬取移動端微博信息?(強推)\2016-04-23\spider_selenium_sina_content.py

?????文件????????840??2018-11-13?15:54??[源碼]?爬取移動端微博信息(附贈客戶端代碼)\運行配置過程.txt

?????目錄??????????0??2018-11-13?15:54??[源碼]?爬取移動端微博信息(附贈客戶端代碼)\[源碼]?爬取移動端微博信息?(強推)\2016-04-23

?????目錄??????????0??2018-11-13?15:54??[源碼]?爬取移動端微博信息(附贈客戶端代碼)\[源碼]?爬取移動端個人信息?關注id和粉絲id?(速度慢)

?????目錄??????????0??2018-11-13?15:54??[源碼]?爬取移動端微博信息(附贈客戶端代碼)\[源碼]?爬取移動端微博信息?(強推)

?????目錄??????????0??2018-11-13?16:22??[源碼]?爬取移動端微博信息(附贈客戶端代碼)

-----------?---------??----------?-----??----

???????????????298028????????????????????13


評論

共有 條評論