資源簡介
中文維基百科語料庫,將其轉換為文本文件后,進行繁體字轉換為簡體字,字符集轉換,分詞,然后訓練得到模型以及向量。由于文件上傳的大小限制是60MB,而訓練后的所有文件大小有1G以上,所以這里只提供了下載鏈接,地址在網盤中。使用python中的gensim包進行訓練得到的,運行時間較長,純粹的維基百科中文語料訓練后的結果,拿去可以直接使用。

代碼片段和文件信息
?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
?????文件??????????52??2017-02-23?10:35??wiki.zh.text.vector_url
-----------?---------??----------?-----??----
?????文件??????????52??2017-02-23?10:35??wiki.zh.text.vector_url
- 上一篇:Python實現高斯投影正反算
- 下一篇:瘋狂Python講義_李剛_2019
評論
共有 條評論