-
大小: 389KB文件類型: .pdf金幣: 1下載: 0 次發(fā)布日期: 2021-07-18
- 語言: 其他
- 標(biāo)簽: Clementine??
資源簡介
可視化數(shù)據(jù)挖掘應(yīng)用實例一則——某銀行信貸規(guī)則評估
吳源林
(上海財經(jīng)大學(xué)MBA 學(xué)院,上海 200083)
摘要:本文應(yīng)用 Clementine 工具,通過對某銀行評估客戶信用申請的資料挖掘,展示
了數(shù)據(jù)挖掘中遇到的問題和解決思路。
關(guān)鍵詞:數(shù)據(jù)挖掘;決策樹;Clementine
數(shù)據(jù)挖掘是運用模式識別技術(shù),以及統(tǒng)計和數(shù)
學(xué)知識,通過對大量的、不完全的、有噪聲的、模
糊的、隨機的數(shù)據(jù)集進行詳盡審查挖掘,以發(fā)現(xiàn)數(shù)
據(jù)中內(nèi)在的關(guān)聯(lián)性、特征和趨勢。數(shù)據(jù)挖掘綜合了
多種學(xué)科技術(shù),能提供數(shù)據(jù)分類、聚類、關(guān)聯(lián)和預(yù)
測等功能。
近年來,數(shù)據(jù)挖掘技術(shù)已經(jīng)在
國外多行業(yè)中得到了普遍應(yīng)用,尤
其在金融、電信、零售等領(lǐng)域。許
多企業(yè)紛紛利用數(shù)據(jù)挖掘技術(shù)作為
他們獲取競爭優(yōu)勢的戰(zhàn)略工具,典
型的數(shù)據(jù)挖掘應(yīng)用包括生產(chǎn)營運管
理、營銷管理和信用分析等。一些
軟件公司也推出了功能強大、用戶
友好的數(shù)據(jù)挖掘應(yīng)用軟件,如SAS
公司的Data Miner,SPSS 公司的
Clementine,IBM Intelligent Miner
等,微軟公司在其客戶關(guān)系管理軟
件CRM3.0 中也集成了部分?jǐn)?shù)據(jù)挖
掘功能。
目前國內(nèi)不少企業(yè)也正在引進
和開始實施這些技術(shù),以期提高其
決策管理能力和競爭優(yōu)勢。但數(shù)據(jù)
挖掘不僅僅是一個技術(shù)運用問題,
其涉及到商務(wù)活動中的各個方面。
如果我們對所研究的問題和數(shù)據(jù)挖掘方法的認(rèn)識不
夠深入的話,則很可能得到錯誤的信息,造成巨大
的經(jīng)濟損失。
本文通過對日本某銀行審批客戶申請貸款的記
錄進行挖掘,展示數(shù)據(jù)挖掘中可能遇到的問題和解
決思路,并希望能起到拋磚引玉的作用。
數(shù)據(jù)挖掘功能的強大性,使其幾乎可以運用于
任何商業(yè)或科研領(lǐng)域,為了保障數(shù)據(jù)挖掘的質(zhì)量和
有效性,SPSS 公司聯(lián)合幾大行業(yè)巨頭制定了“數(shù)據(jù)
挖掘跨行業(yè)標(biāo)準(zhǔn)流程”(CRISP-DM1)。我們下面的
挖掘過程也將嚴(yán)格按照該流程進行。為清晰展現(xiàn)整
個數(shù)據(jù)挖掘流程, 我們使用了SPSS 公司的
Clementine 工具。該工具使用節(jié)點連接的方式建立
模型,能讓我們直觀了解建模過程,并把注意力集
中在具體問題的分析上。
一、商業(yè)理解,亦即研究理解階段
這一階段把項目的目標(biāo)和要求用清晰的,并把
這些目標(biāo)和制約條件轉(zhuǎn)化成數(shù)據(jù)挖掘問題的定義,
形成一個初步實現(xiàn)目標(biāo)的策略;
在本例中,我們的目標(biāo)是要找出銀行批準(zhǔn)或否
代碼片段和文件信息
評論
共有 條評論