資源簡介
針對K-means算法因隨機選取聚類中心而易造成聚類結果不穩定的問題,提出PCA-KDKM算法。該算法使用主成分分析法對數據集的屬性降維,提取主屬性;利用k′dist曲線自動獲取k值;計算平緩曲線上所含數據對象的均值并選取其中一值,作為首個初始聚類中心;利用基于密度和最大最小距離的算法思想進行聚類;結合類間距離和類內聚類提出聚類質量評價函數。將該算法與K-means、KNE-KM、QMC-KM、CFSFDP-KM在UCI數據集上進行聚類比較,結果表明該算法聚類結果穩定,聚類準確率高。將PCA-KDKM算法應用在微博輿情分析中,抓取不同類別的數萬條數據進行聚類分析。實驗結果表明,PCA-KDKM
代碼片段和文件信息
- 上一篇:丁沖水庫大壩滲流性態安全分析和評價
- 下一篇:基于聲納判斷的機器人避障
評論
共有 條評論