xxxx18一60岁hd中国/日韩女同互慰一区二区/西西人体扒开双腿无遮挡/日韩欧美黄色一级片 - 色护士精品影院www

  • 大小: 15KB
    文件類型: .py
    金幣: 1
    下載: 0 次
    發布日期: 2021-01-06
  • 語言: Python
  • 標簽: chi??ig??mi??python??

資源簡介

使用python,計算兩類文檔的chi、ig、mi值。其中文檔類型比例為1:1,可以自己調整。

資源截圖

代碼片段和文件信息

import?numpy?as?np
import?jieba
import?csv
import?os
import?sys
import?re

#用于獲得年報的內容和分類。其中wordlist為[[年報一分詞][年報二分詞]...],classlist為[[年報一類別][年報二類別]...]
def?get_content_annual_1_1():
????wordList=[]
????classList=[]
????with?open(“ST信息預處理.csv“encoding=‘utf-8-sig‘)?as?csvfile:
????????readCSV?=?csv.reader(csvfile)
????????for?row?in?readCSV:
????????????stName=row[0][:-3]+‘-‘+row[1]
????????????nomalName_1?=?‘‘
????????????ifExist?=?True
????????????i=2
????????????while?ifExist:
????????????????if?os.path.exists(‘F:/作業/srp/chenyiyun/詞語分析/年報/‘
??????????????????????????????????+row[i][:-3]+‘-‘+row[1]+‘.txt‘):
????????????????????nomalName_1=row[i][:-3]+‘-‘+row[1]
????????????????????ifExist?=?False
????????????????else:
????????????????????print(row[0])
????????????

評論

共有 條評論