資源簡介
? 數(shù)據(jù)抓取子系統(tǒng):是及時、高效的收集數(shù)量盡可能多的有用的萬維網(wǎng)頁面,以及建立他們之間的超鏈接的關(guān)系。
? 內(nèi)容索引子系統(tǒng):網(wǎng)頁檢索子系統(tǒng)的主要職責(zé)就是組織好海量的網(wǎng)頁數(shù)據(jù),是內(nèi)容檢索子系統(tǒng)能夠高效的進(jìn)行檢索。
? 內(nèi)容檢索子系統(tǒng):計算用戶輸入查詢詞與系統(tǒng)索引頁面的內(nèi)容相關(guān)程度,它是決定頁面順序的重要因素之一。
? 鏈接結(jié)構(gòu)分析子系統(tǒng):通過對萬維網(wǎng)索引鏈接結(jié)構(gòu)的挖掘,分析評估萬維網(wǎng)數(shù)據(jù)的質(zhì)量、擴充萬維網(wǎng)數(shù)據(jù)的描述內(nèi)容,為提升搜索引擎系統(tǒng)的整體性能服務(wù)。
代碼片段和文件信息
評論
共有 條評論