-
大小: 3.40MB文件類型: .pdf金幣: 1下載: 0 次發(fā)布日期: 2021-04-01
- 語(yǔ)言: 其他
- 標(biāo)簽:
資源簡(jiǎn)介
COCA 20000高頻詞匯。 COCA=Corpus of Contemporary American English (COCA) 這是英語(yǔ)國(guó)家使用頻率最高的詞匯集合。 從眾多語(yǔ)料庫(kù)(corpus)中提取。用大數(shù)據(jù)的方法從各種文體中自動(dòng)生成一個(gè)詞頻表。這是當(dāng)今最準(zhǔn)確的詞頻表:美國(guó)當(dāng)代語(yǔ)料庫(kù) coca 中的前20000個(gè)單詞。 簡(jiǎn)單的說(shuō),coca就是把1990-2012年美國(guó)最有代表性的報(bào)紙,雜志,小說(shuō),學(xué)術(shù),口語(yǔ)(口語(yǔ)可能是用的電視劇或者脫口秀之類的節(jié)目轉(zhuǎn)錄的)匯集起來(lái),每部分各占1/5,生成4.5億單詞量語(yǔ)料庫(kù)。
代碼片段和文件信息
評(píng)論
共有 條評(píng)論