面试官问给你一个非常大的英文文本,统计词频,用什么算法,应该怎么回答?
过一遍文本,用合适的字符(比如空格标点)分词。词放入hashmap,最后对hashmap排序。
Hadoop,MR.
可以使用字典树。
2 回答5.2k 阅读✓ 已解决
4 回答1.6k 阅读✓ 已解决
4 回答1.4k 阅读✓ 已解决
1 回答2.6k 阅读✓ 已解决
4 回答2.1k 阅读
2 回答798 阅读✓ 已解决
1 回答846 阅读✓ 已解决
1 回答2.7k 阅读
5 回答8.9k 阅读✓ 已解决
2 回答4.2k 阅读
3 回答11.5k 阅读
1 回答3k 阅读✓ 已解决
过一遍文本,用合适的字符(比如空格标点)分词。词放入hashmap,最后对hashmap排序。