用Lucene做了个文档检索系统,对于分词维护一套字典,现在想把例如搜狗输入法的热门词库同步到我的字典中,但是发现搜狗输入法好像没有对外的API,请问有什么实现方式,别的中文输入法能实现也可以。
用Lucene做了个文档检索系统,对于分词维护一套字典,现在想把例如搜狗输入法的热门词库同步到我的字典中,但是发现搜狗输入法好像没有对外的API,请问有什么实现方式,别的中文输入法能实现也可以。
8 回答6.6k 阅读
4 回答714 阅读✓ 已解决
2 回答3.4k 阅读
3 回答1.9k 阅读✓ 已解决
1 回答2.2k 阅读✓ 已解决
1 回答2.1k 阅读✓ 已解决
1 回答974 阅读✓ 已解决
我忘记这代码是从哪儿来的了,大概是从这个改的吧:http://yongsun.me/2010/07/%E5%AF%BC%E5%85%A5sogou%E8%BE%93%E5%85%A5%E6%B3%95%E7%9A%84%E7%BB%86%E8%83%9E%E8%AF%8D%E5%BA%93/
importer.py
然后到 http://pinyin.sogou.com/dict/ 下载搜狗细胞词库。运行
./importer.py 文件名
运行后会向标准输出输出 *.scel 文件里的所有词,每行一个。