資源簡介
? 數(shù)據(jù)抓取子系統(tǒng):是及時、高效的收集數(shù)量盡可能多的有用的萬維網(wǎng)頁面,以及建立他們之間的超鏈接的關系。
? 內容索引子系統(tǒng):網(wǎng)頁檢索子系統(tǒng)的主要職責就是組織好海量的網(wǎng)頁數(shù)據(jù),是內容檢索子系統(tǒng)能夠高效的進行檢索。
? 內容檢索子系統(tǒng):計算用戶輸入查詢詞與系統(tǒng)索引頁面的內容相關程度,它是決定頁面順序的重要因素之一。
? 鏈接結構分析子系統(tǒng):通過對萬維網(wǎng)索引鏈接結構的挖掘,分析評估萬維網(wǎng)數(shù)據(jù)的質量、擴充萬維網(wǎng)數(shù)據(jù)的描述內容,為提升搜索引擎系統(tǒng)的整體性能服務。
代碼片段和文件信息
評論
共有 條評論