-
大小: 716KB文件類型: .pdf金幣: 1下載: 0 次發(fā)布日期: 2021-07-11
- 語(yǔ)言: 其他
- 標(biāo)簽: 遙感數(shù)據(jù)??缺失數(shù)據(jù)??
資源簡(jiǎn)介
由于數(shù)據(jù)的記錄,維護(hù),處理和存儲(chǔ)方式,大數(shù)據(jù)分析面臨挑戰(zhàn)。 我們證明了分層的,多元的統(tǒng)計(jì)機(jī)器學(xué)習(xí)算法,即增強(qiáng)回歸樹(shù)(BRT)可以解決大數(shù)據(jù)挑戰(zhàn)以推動(dòng)決策。 這項(xiàng)研究面臨的挑戰(zhàn)是缺乏互操作性,因?yàn)閿?shù)據(jù),GIS形狀文件集合,遙感圖像以及聚合和內(nèi)插的時(shí)空信息都存儲(chǔ)在整體硬件組件中。 對(duì)于建模過(guò)程,有必要?jiǎng)?chuàng)建一個(gè)公共輸入文件。 通過(guò)將數(shù)據(jù)源合并在一起,創(chuàng)建了一個(gè)結(jié)構(gòu)化但嘈雜的輸入文件,該文件顯示了不一致和冗余。 在此表明,BRT可以處理不同的數(shù)據(jù)粒度,異構(gòu)數(shù)據(jù)和丟失。 特別是,BRT的優(yōu)點(diǎn)是默認(rèn)情況下允許通過(guò)區(qū)分是否缺失值以及缺失值來(lái)處理缺失數(shù)據(jù)。 最重要的是,BRT提供了多種關(guān)于結(jié)果解釋的可能性,并且通過(guò)考慮使用變量在樹(shù)中定義拆分的頻率來(lái)自動(dòng)執(zhí)行變量選擇。 與兩個(gè)類似的回歸模型(隨機(jī)森林和最小絕對(duì)收縮和選擇算子,LASSO)的比較表明,在這種情況下,BRT的性能優(yōu)于后者。 BRT還可作為現(xiàn)實(shí)場(chǎng)景中復(fù)雜的層次建模的起點(diǎn)。 例如,可以使用現(xiàn)有模型來(lái)測(cè)試BRT的單一方法或整體方法,以改善各種數(shù)據(jù)驅(qū)動(dòng)的決策和應(yīng)用程序的結(jié)果。
代碼片段和文件信息
評(píng)論
共有 條評(píng)論