条件分布频率
《自然语言学习》很多地方都用到了条件分布频率,nltk提供了两种常用的接口:
FreqDist
和ConditionalFreqDist
。后面很多都会用到这两种方法,特别是第二个。因为第二个更符合定义,会智能的找到条件。
然后根据绘图的库,可以做出来很漂亮的图形。
简单的FreqDist
函数接收list类型的参数后,会自动创建字典,生成对应的值为键值,而value就是元素的次数。
from nltk import *tem = ['hello','world','hello','dear']print(FreqDist(tem))
out: FreqDist({'dear': 1, 'hello': 2, 'world': 1})
通过
网友评论