資源簡介
包含數據分析和數據挖掘的學習代碼和實戰代碼
本項目很多內容屬于邊學邊試。參考了書籍,但是很多代碼存在過時和錯誤均被我修改。
數據挖掘是最近幾年才出現的一個名詞,其歸根到底的目的就是經過一系列手段處理數據得到一個適合的建模數據,利用建模數據建立模型挖掘已有數據的隱含價值。
一般步驟(詳細內容子目錄有敘述,且后面的實戰項目我會嚴格按照這個步驟進行)
數據獲取
利用各種手段獲取數據,數據樣式不限制,但一般而言是形如excel或者csv這樣的表格格式。
數據探索
對數據進行初步探索,得到數據特征(如每一列的平均值,分位數,最大最小值,空值數目)。
數據預處理
毫不夸張,這是整個數據挖掘過程中最費時間的部分。對原始數據進行處理,得到合適的建模數據(如處理異常值,屬性規約,數據清洗,數據變換,數據標準化)。
數據挖掘建模
如果任務明確,模型的選擇是指定的,但是算法的優化,準確率的考究等是需要處理的。(如分類預測、關聯規則獲取。
后續處理
一般是指模型的實際應用。
代碼片段和文件信息
?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
?????文件???????????0??2020-07-23?01:26??鍖呭惈鏁版嵁鍒嗘瀽鍜屾暟鎹寲鎺樼殑瀛︿範浠g爜鍜屽疄鎴樹唬鐮?
?????文件????63744343??2020-07-23?01:24??鍖呭惈鏁版嵁鍒嗘瀽鍜屾暟鎹寲鎺樼殑瀛︿範浠g爜鍜屽疄鎴樹唬鐮?DataMining-master.zip
?????文件?????????520??2020-07-23?01:24??__MACOSX\鍖呭惈鏁版嵁鍒嗘瀽鍜屾暟鎹寲鎺樼殑瀛︿範浠g爜鍜屽疄鎴樹唬鐮?._DataMining-master.zip
-----------?---------??----------?-----??----
?????文件???????????0??2020-07-23?01:26??鍖呭惈鏁版嵁鍒嗘瀽鍜屾暟鎹寲鎺樼殑瀛︿範浠g爜鍜屽疄鎴樹唬鐮?
?????文件????63744343??2020-07-23?01:24??鍖呭惈鏁版嵁鍒嗘瀽鍜屾暟鎹寲鎺樼殑瀛︿範浠g爜鍜屽疄鎴樹唬鐮?DataMining-master.zip
?????文件?????????520??2020-07-23?01:24??__MACOSX\鍖呭惈鏁版嵁鍒嗘瀽鍜屾暟鎹寲鎺樼殑瀛︿範浠g爜鍜屽疄鎴樹唬鐮?._DataMining-master.zip
評論
共有 條評論