資源簡介
針對K-means算法因隨機選取聚類中心而易造成聚類結(jié)果不穩(wěn)定的問題,提出PCA-KDKM算法。該算法使用主成分分析法對數(shù)據(jù)集的屬性降維,提取主屬性;利用k′dist曲線自動獲取k值;計算平緩曲線上所含數(shù)據(jù)對象的均值并選取其中一值,作為首個初始聚類中心;利用基于密度和最大最小距離的算法思想進行聚類;結(jié)合類間距離和類內(nèi)聚類提出聚類質(zhì)量評價函數(shù)。將該算法與K-means、KNE-KM、QMC-KM、CFSFDP-KM在UCI數(shù)據(jù)集上進行聚類比較,結(jié)果表明該算法聚類結(jié)果穩(wěn)定,聚類準確率高。將PCA-KDKM算法應用在微博輿情分析中,抓取不同類別的數(shù)萬條數(shù)據(jù)進行聚類分析。實驗結(jié)果表明,PCA-KDKM
代碼片段和文件信息
- 上一篇:丁沖水庫大壩滲流性態(tài)安全分析和評價
- 下一篇:基于聲納判斷的機器人避障
評論
共有 條評論