資源簡介
大數據的挖掘是當今的研究熱點,也有著巨大的商業價值。新型框架Spark部署在Hadoop平臺上,它的機器學習算法幾乎可以完全替代傳統的Mahout Map Reduce的編程模式,但由于Spark的內存模型特點,執行速度快。該文研究了Spark中的機器學習中的聚類算法KMeans,先分析了算法思想,再通過實驗分析其應用的方法,然后通過實驗結果分析其應用場景和不足。
代碼片段和文件信息
- 上一篇:commvault備份系統基本原理.zip
- 下一篇:數字電路復習資料
評論
共有 條評論