xxxx18一60岁hd中国/日韩女同互慰一区二区/西西人体扒开双腿无遮挡/日韩欧美黄色一级片 - 色护士精品影院www

  • 大小: 749KB
    文件類型: .zip
    金幣: 2
    下載: 1 次
    發布日期: 2021-06-17
  • 語言: Java
  • 標簽: java??

資源簡介

最近,由于一些需要,用到了java和正則,做了個的足球網站的數據采集程序,由于是第一次做關于java的html頁面數據采集,必然在網上查找了很多資料,但是發現運用如此廣泛的java在使用正則做html采集方面的(中文)文章是少之又少,都是簡單的談了下java正則的概念,沒有真正用在實際網頁html采集,所以實例教程更是寥寥無幾(雖然java有它自己的Html Parser,而且十分強大),但個人覺得作為如此深入人心的正則表達式,理應有其相關的java實例教程,而且應該很多很全.于是在完成java版的html數據采集程序之后,本人便打算寫個關于正則表達式在java上的html頁面采集,以便有相關興趣的讀者更好的學習.

資源截圖

代碼片段和文件信息

import?java.io.BufferedReader;
import?java.io.IOException;
import?java.io.InputStreamReader;
import?java.net.URL;
/**
?*?DataStorage類?用于數據的收集和存儲
?*?@author?SoFlash?-?博客園??http://www.cnblogs.com/longwu
?*/
public?class?DataStorage?{

public?void?dataStore()?{
//?首先用一個字符串?來裝載網頁鏈接
String?strUrl?=?“http://www.footballresults.org/league.php?all=1&league=EngPrem“;

String?sqlLeagues?=?““;
try?{
//?創建一個url對象來指向?該網站鏈接?括號里()裝載的是該網站鏈接的路徑
//?更多可以看看?http://wenku.baidu.com/view/8186caf4f61fb7360b4c6547.html
URL?url?=?new?URL(strUrl);
//?InputStreamReader?是一個輸入流讀取器?用于將讀取的字節轉換成字符
//?更多可以看看?http://blog.sina.com.cn/s/blog_44a05959010004il.html
InputStreamReader?isr?=?new?InputStreamReader(url.openStream()
“utf-8“);?//?統一使用utf-8?編碼模式
//?使用?BufferedReader?來讀取?InputStreamReader?轉換成的字符
BufferedReader?br?=?new?BufferedReader(isr);
String?strRead?=?““;?//?new?一個字符串來裝載?BufferedReader?讀取到的內容

//?定義3個正則?用于獲取我們需要的數據
String?regularDate?=?“(\\d{12}\\.\\d{12}\\.\\d{4})“;
String?regularTwoTeam?=?“>[^<>]*“;
String?regularResult?=?“>(\\d{12}-\\d{12})“;

//創建?GroupMethod類的對象?gMethod?方便后期調用其類里的?regularGroup方法
GroupMethod?gMethod?=?new?GroupMethod();
????????????//創建DataStructure數據結構?類的對象???用于數據下面的數據存儲
DataStructure?ds?=?new?DataStructure();
//創建MySql類的對象?用于執行MySql語句
MySql?ms?=?new?MySql();
int?i?=?0;?//?定義一個i來記錄循環次數?即收集到的球隊比賽結果數
int?index?=?0;?//?定義一個索引?用于獲取分離?2個球隊的數據?因為2個球隊正則是相同的
//?開始讀取數據?如果讀到的數據不為空?則往里面讀
while?((strRead?=?br.readLine())?!=?null)?{
/**
?*?用于捕獲日期數據
?*/
String?strGet?=?gMethod.regularGroup(regularDate?strRead);
//?如果捕獲到了符合條件的?日期數據?則打印出來

if?(!strGet.equals(““))?{
//System.out.println(“Date:“?+?strGet);
//將收集到的日期存在數據結構里
ds.date?=?strGet;
//?這里索引+1?是用于獲取后期的球隊數據
++index;?//?因為在html頁面里?源代碼里?球隊數據是在剛好在日期之后
}
/**
?*?用于獲取2個球隊的數據
?*/
strGet?=?gMethod.regularGroup(regularTwoTeam?strRead);
if?(!strGet.equals(““)?&&?index?==?1)?{?//?索引為1的是主隊數據
//?通過subtring方法?分離出?主隊數據
strGet?=?strGet.substring(1?strGet.indexOf(““));
//System.out.println(“HomeTeam:“?+?strGet);?//?打印出主隊
//將收集到的主隊名稱?存到?數據結構里
ds.homeTeam?=?strGet;
index++;?//?索引+1之后?為2了
//?通過subtring方法?分離出?客隊
}?else?if?(!strGet.equals(““)?&&?index?==?2)?{?//?這里索引為2的是客隊數據
strGet?=?strGet.substring(1?strGet.indexOf(““));
//System.out.println(“AwayTeam:“?+?strGet);?//?打印出客隊
//將收集到的客隊名稱?存到數據結構里
ds.awayTeam?=?strGet;
index?=?0;??//收集完客隊名稱后?需要將索引還原?用于收集下一條數據的主隊名稱
}
/**
?*?用于獲取比賽結果
?*/
strGet?=?gMethod.regularGroup(regularResult?strRead);
if?(!strGet.equals(““))?{
//?這里同樣用到了substring方法?來剔除‘<‘?和?““?標簽?來獲取我們想要的比賽結果
strGet?=?strGet.substring(1?strGet.indexOf(““));
//System.out.println(“Result:“?+?strGet);
ds.result?=?strGet;?//將收集到的比賽結果存到數據結構里
//System.o

?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
?????目錄???????????0??2012-01-23?06:04??htmlDataStorage\
?????文件?????????375??2012-01-03?01:29??htmlDataStorage\.classpath
?????文件?????????403??2011-12-22?23:32??htmlDataStorage\.project
?????目錄???????????0??2012-01-23?06:04??htmlDataStorage\.settings\
?????文件?????????629??2011-12-22?23:32??htmlDataStorage\.settings\org.eclipse.jdt.core.prefs
?????目錄???????????0??2012-01-23?06:04??htmlDataStorage\bin\
?????文件????????2896??2012-01-23?06:02??htmlDataStorage\bin\DataStorage.class
?????文件?????????355??2012-01-23?06:02??htmlDataStorage\bin\DataStructure.class
?????文件?????????873??2012-01-23?06:02??htmlDataStorage\bin\GroupMethod.class
?????文件?????????450??2012-01-23?06:03??htmlDataStorage\bin\Main.class
?????文件????????1739??2012-01-23?06:02??htmlDataStorage\bin\MySql.class
?????文件??????789885??2011-11-10?18:31??htmlDataStorage\mysql-connector-java-5.1.18-bin.jar
?????目錄???????????0??2012-01-23?06:04??htmlDataStorage\src\
?????文件????????4267??2012-01-23?06:02??htmlDataStorage\src\DataStorage.java
?????文件?????????259??2012-01-23?06:02??htmlDataStorage\src\DataStructure.java
?????文件?????????586??2012-01-23?06:02??htmlDataStorage\src\GroupMethod.java
?????文件?????????281??2012-01-23?06:03??htmlDataStorage\src\Main.java
?????文件????????1360??2012-01-23?06:02??htmlDataStorage\src\MySql.java

評論

共有 條評論