-
大小: 4KB文件類型: .py金幣: 1下載: 0 次發布日期: 2021-01-03
- 語言: Python
- 標簽:
資源簡介
最新的詞語相似度計算方法;基于詞林和知網的詞語相似度計算;版權歸原作者所有,僅供學習交流使用;
代碼片段和文件信息
#?-*-?coding:?utf-8?-*-
‘‘‘
@author:?yaleimeng@sina.com
@license:?(C)?Copyright?2017
@desc:?混合采用詞林和知網的相似度計算方法。得到更加符合人們感覺的相似度數值。
@DateTime:?Created?on?2018/1/25?at?上午?08:59?by?PyCharm?‘‘‘
from?hownet.howNet?import?How_Similarity
from?cilin.ciLin?import?CilinSimilarity
class?HybridSim():
????‘‘‘
????混合相似度計算策略。使用了詞林與知網詞匯量的并集。擴大了詞匯覆蓋范圍。
????‘‘‘
????ci_lin?=?CilinSimilarity()??#?實例化詞林相似度計算對象
????how_net?=?How_Similarity()??#?實例化知網相似度計算對象
????Common?=?ci_lin.vocab?&?how_net.vocab
????A?=?how_net.vocab?-?ci_lin.vocab
????B?=?ci_lin.vocab?-?how_net.vocab
????@classmethod
????def?get_Final_sim(cls?w1?w2):
????????lin?=?cls.ci_lin.sim2016(w1?w2)?if?w1?in?cls.ci_lin.vocab?and?w2?in?cls.ci_lin.vocab?else?0
????????how?=?cls.how_net.calc(w1?w2)?if?w1?in?cls.how_net.voca
評論
共有 條評論