我将 spacy 与 python 一起使用,它可以很好地标记每个单词,但我想知道是否有可能在字符串中找到最常见的单词。还有最常见的名词、动词、副词等是否可以得到?
包含一个 count_by 函数,但我似乎无法让它以任何有意义的方式运行。
原文由 Harry Loyd 发布,翻译遵循 CC BY-SA 4.0 许可协议
我将 spacy 与 python 一起使用,它可以很好地标记每个单词,但我想知道是否有可能在字符串中找到最常见的单词。还有最常见的名词、动词、副词等是否可以得到?
包含一个 count_by 函数,但我似乎无法让它以任何有意义的方式运行。
原文由 Harry Loyd 发布,翻译遵循 CC BY-SA 4.0 许可协议
2 回答5.2k 阅读✓ 已解决
2 回答1.2k 阅读✓ 已解决
4 回答1.5k 阅读✓ 已解决
3 回答1.4k 阅读✓ 已解决
3 回答1.3k 阅读✓ 已解决
2 回答927 阅读✓ 已解决
1 回答1.8k 阅读✓ 已解决
1 回答1.3k 阅读
2 回答1.2k 阅读✓ 已解决
1 回答1.2k 阅读
1 回答1.2k 阅读
2 回答3.2k 阅读✓ 已解决
我最近不得不计算文本文件中所有标记的频率。您可以使用 pos_ 属性过滤掉单词以获得您喜欢的 POS 令牌。这是一个简单的例子: