資源簡介
最新的ansj分詞工具jar包,用于在ecplise中使用ansj分詞。ansj是由孫健開發(fā)的一個(gè)基于n-Gram+CRF+HMM的中文分詞的java實(shí)現(xiàn)。分詞速度達(dá)到每秒鐘大約200萬字左右(mac air下測試),準(zhǔn)確率能達(dá)到96%以上。目前實(shí)現(xiàn)了:中文分詞、中文姓名識(shí)別、用戶自定義詞典、關(guān)鍵字提取、自動(dòng)摘要、關(guān)鍵字標(biāo)記等功能。可以應(yīng)用到自然語言處理等方面,適用于對(duì)分詞效果要求高的各種項(xiàng)目。作者在最新的分詞方式里增加了基于深度學(xué)習(xí)的分詞方式。
代碼片段和文件信息
- 上一篇:學(xué)生日程管理
- 下一篇:公交查詢系統(tǒng)
評(píng)論
共有 條評(píng)論