資源簡(jiǎn)介
本次提供的中文漢語(yǔ)語(yǔ)料syj_trainCorpus_utf8.txt全網(wǎng)免費(fèi),轉(zhuǎn)載需要注明出處,語(yǔ)料是作者通過(guò)爬取的短文本和網(wǎng)絡(luò)上的預(yù)料處理、合并生成的。整個(gè)語(yǔ)料大小264M,包含1116903條數(shù)據(jù),數(shù)據(jù)用空格隔開(kāi),可以用來(lái)訓(xùn)練分詞模型。
代碼片段和文件信息
評(píng)論
共有 條評(píng)論