jieba分词怎样 去掉或替换 默认词库里的词?

DunkOnly
  • 612

现在我cut

我想看电视

结果是

我 想 看电视

看了下默认的词库里有 看电视 这个词。。

我想搞成

我 想 看 电视
回复
阅读 18.1k
3 个回答

jieba.add_word方法里目前还有个bug,
jieba主干已经修复了,但是旧版本可能会有
要把if freq改成if freq is not None
因为freq如果是0的话会有这个bug

jieba.add_word("看电视",0)#或者jieba.del_word("看电视")
jieba.add_word("看",100,"v")
jieba.add_word("电视",100,"n")

文档里说的很清楚了
调整词典

clipboard.png

你需要的功能:

clipboard.png

becauseofyoubob
  • 2
新手上路,请多包涵

把默认词库的‘看电视’删掉,加入‘看 3 nr’、‘电视 3 nr’,默认词库位置在安装目录下的lib/site-packages/jieba/下有一个dict.txt的文档,直接修改保存即可。最后记得删除jieba缓存文件后再运行程序(系统默认用户缓存应用程序的目录下,或者可以搜索jieba.cache文件删除)。

宣传栏