我从 这里 得到了我的改变的问题。我有以下代码:
from nltk.corpus import stopwords
def content_text(text):
stopwords = nltk.corpus.stopwords.words('english')
content = [w for w in text if w.lower() in stopwords]
return content
如何 打印 1) 包含 和 2) 排除 停用词的文本中出现频率最高的 10 个词?
原文由 user2064809 发布,翻译遵循 CC BY-SA 4.0 许可协议
nltk中有一个FreqDist函数
提取 10 个最常见的: