-
大小: 32.13M文件類型: .pdf金幣: 1下載: 0 次發(fā)布日期: 2023-06-26
- 語言: 其他
- 標(biāo)簽: 數(shù)據(jù)挖掘??數(shù)據(jù)??算法??
資源簡介
隨著數(shù)據(jù)集規(guī)模和復(fù)雜度的持續(xù)上升,分析員必須利用更高級的軟件工具來執(zhí)行間接的、自動的智能化數(shù)據(jù)分析。《數(shù)據(jù)挖掘:概念、模型、方法和算法(第2版)》介紹了通過分析高維數(shù)據(jù)空間中的海量原始數(shù)據(jù)來提取用于決策的新信息的尖端技術(shù)和方法。
本書開篇闡述數(shù)據(jù)挖掘原理,此后在示例的引導(dǎo)下詳細(xì)講解起源于統(tǒng)計學(xué)、機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、模糊邏輯和演化計算等學(xué)科的具有代表性的、最前沿的挖掘方法和算法。本書還著重描述如何恰當(dāng)?shù)剡x擇方法和數(shù)據(jù)分析軟件并合理地調(diào)整參數(shù)。每章末尾附有復(fù)習(xí)題。
本書主要用作計算機(jī)科學(xué)、計算機(jī)工程和計算機(jī)信息系統(tǒng)專業(yè)的研究生數(shù)據(jù)挖掘教材,高年級本科生或具備同等教育背景的讀者也完全可以理解本書的所有主題。
◆ 介紹支持向量機(jī)(SVM)和Kohonen映射
◆ 講解DBSCAN、BIRCH和分布式DBSCAN聚類算法
◆ 介紹貝葉斯網(wǎng)絡(luò),討論圖形中的Betweeness和Centrality參數(shù)測量算法
◆ 分析在建立決策樹時使用的CART算法和基尼指數(shù)
◆ 介紹Bagging & Boosting集成學(xué)習(xí)方法,并詳述AdaBoost算法
◆ 討論Relief以及PageRank算法
◆ 討論文本挖掘的潛在語義分析(LSA),并分析如何測定文本文檔之間的語義相似性
◆ 講解時態(tài)、空間、Web、文本、并行和分布式數(shù)據(jù)挖掘等新主題
◆ 更詳細(xì)地講解數(shù)據(jù)挖掘技術(shù)商業(yè)、隱私、安全和法律方面的內(nèi)容
代碼片段和文件信息
評論
共有 條評論