这是一个简单快速的词库工具,用来从一段文本中找出存在于词库的词语。
特点
简单:纯 PHP 实现,无需安装扩展。
快速:查找耗时跟词库大小关系不大(我的小破本上查询 40 万的词库轻轻松松),不会一次性加载整个词库,使用时内存占用小(就是生成词库的时候有点费内存)。
https://github.com/nowgoo/dict/
大神能否转成python的,或者python是否已有这种项目?
这是一个简单快速的词库工具,用来从一段文本中找出存在于词库的词语。
特点
简单:纯 PHP 实现,无需安装扩展。
快速:查找耗时跟词库大小关系不大(我的小破本上查询 40 万的词库轻轻松松),不会一次性加载整个词库,使用时内存占用小(就是生成词库的时候有点费内存)。
https://github.com/nowgoo/dict/
大神能否转成python的,或者python是否已有这种项目?
4 回答4.4k 阅读✓ 已解决
4 回答3.8k 阅读✓ 已解决
1 回答2.9k 阅读✓ 已解决
3 回答2.1k 阅读✓ 已解决
1 回答4k 阅读✓ 已解决
3 回答1.8k 阅读✓ 已解决
1 回答4.5k 阅读✓ 已解决
如果你要分词的话,可以考虑结巴分词
https://github.com/fxsjy/jieba