資源簡介
波士頓房價機器學習作業(yè)python編碼,策樹算法是一種逼近離散函數(shù)值的方法。它是一種典型的分類方法,首先對數(shù)據(jù)進行處理,利用歸納算法生成可讀的規(guī)則和決策樹,然后使用決策對新數(shù)據(jù)進行分析。本質(zhì)上決策樹是通過一系列規(guī)則對數(shù)據(jù)進行分類的過程。
決策樹方法最早產(chǎn)生于上世紀60年代,到70年代末。由J Ross Quinlan提出了ID3算法,此算法的目的在于減少樹的深度。但是忽略了葉子數(shù)目的研究。C4.5算法在ID3算法的基礎(chǔ)上進行了改進,對于預測變量的缺值處理、剪枝技術(shù)、派生規(guī)則等方面作了較大改進,既適合于分類問題,又適合于回歸問題。
決策樹算法構(gòu)造決策樹來發(fā)現(xiàn)數(shù)據(jù)中蘊涵的分類規(guī)則.如何構(gòu)造精度高、
代碼片段和文件信息
#?-*-?coding:?utf-8?-*-
“““
Created?on?Thu?May?31?13:40:50?2018
@author:?borui
“““
import?numpy?as?np
from?sklearn.tree?import?DecisionTreeRegressor
from?sklearn.ensemble?import?AdaBoostRegressor
from?sklearn?import??datasets
from?sklearn.metrics?import?mean_squared_errorexplained_variance_score
from?sklearn.utils?import?shuffle
import?matplotlib.pyplot?as?plt
#加載房屋數(shù)據(jù)?波士頓房屋價格
housing_data=datasets.load_boston()
#housing_data.data?代表輸入價格housing_data.target代表輸出價格
xy=shuffle(housing_data.datahousing_data.targetrandom_state=7)
#將數(shù)據(jù)分成80%?用于訓練其他用于測試
num_training=int(0.8*len(x))
#訓練數(shù)據(jù)
x_trainy_train=x[:num_training]y[:num_training]
#測試數(shù)據(jù)
x_testy_test=x[num_training:]y[num_training:]
#建立決策樹模型?最大深度是4?限制決策樹的深度
dt_regressor=DecisionTreeRegressor(max_depth=
評論
共有 條評論