安装 NLTK 库
// Python 2.x
pip install nltk
// Python 3.x
pip3 install nltk
下载 NLTK 自带文本库
import nltk
nltk.download()
创建 2-gram 模型
from nltk import FreqDist
from nltk import ngrams
from nltk.book import text6
bigrams = ngrams(text6, 2)
bigramsDist = FreqDist(bigrams)
print(bigramsDist.most_common(10))
参考
《Python 网络数据采集》
欢迎来到这里!
我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。
注册 关于