資源簡介
KMeans Python 代碼的實現,還包括scikit-learn-kMeans Python 代碼的實現,數據文件為txt , 代碼包括讀取txt文件數據到python中
代碼片段和文件信息
#!/usr/bin/python
#?coding=utf-8
from?numpy?import?*
#?加載數據
import?numpy?as?np
def?loadDataSet(fileName):???#?解析文件,按tab分割字段,得到一個浮點數字類型的矩陣
????dataMat?=?[]??????????????#?文件的最后一個字段是類別標簽
????fr?=?open(fileName)
????for?line?in?fr.readlines():
????????curLine?=?line.strip().split(‘\t‘)
????????#?fltLine?=?map(float?curLine)????#?將每個元素轉成float類型
????????curLine?=?line.rstrip()
????????curLine?=?[float(x)?for?x?in?curLine.split()]
????????dataMat.append(curLine)
????return?dataMat
#?計算歐幾里得距離
def?distEclud(vecA?vecB):
????return?sqrt(sum(power(vecA?-?vecB?2)))?#?求兩個向量之間的距離
#?構建聚簇中心,取k個(此例中為4)隨機質心
def?randCent(dataSet?k):
????n?=?shape(dataSet)[1]
????centroids?=?mat(zeros((k?n)))???#?每個質心有n個坐標值,總共要k個質心
????for?j?in?range(n):
????????minJ?=?float(min(dataSet[:?
?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
?????文件????????3330??2018-04-15?21:26??kMeans\kMeans.py
?????文件?????????408??2018-04-15?15:18??kMeans\kMeans.txt
?????文件????????1619??2018-04-15?21:14??kMeans\scikit-learn-kMeans.py
?????目錄???????????0??2018-04-15?21:32??kMeans\
評論
共有 條評論