-
大小: 4.05MB文件類(lèi)型: .pdf金幣: 1下載: 0 次發(fā)布日期: 2023-08-14
- 語(yǔ)言: 其他
- 標(biāo)簽: 數(shù)據(jù)挖掘??文本分類(lèi)??
資源簡(jiǎn)介
本報(bào)告包括詳盡完整的文本分類(lèi)處理過(guò)程,包括語(yǔ)料庫(kù)的處理、jieba分詞、停用詞無(wú)關(guān)詞處理、詞袋模型的構(gòu)建(CHI值檢驗(yàn)用于特征篩選、tfidf作為特征向量值)。并用自編樸素貝葉斯以及sklearn包中的SVM進(jìn)行了文本效果的檢測(cè),通過(guò)混淆矩陣和roc曲線展現(xiàn)了實(shí)現(xiàn)效果。實(shí)驗(yàn)報(bào)告寫(xiě)的很詳細(xì),不懂的地方可以看報(bào)告以及看博客中的部分細(xì)節(jié)講解。
代碼片段和文件信息
- 上一篇:S-57電子海圖文件
- 下一篇:電機(jī)統(tǒng)一理論英 阿德金斯PDF
評(píng)論
共有 條評(píng)論