jieba分词怎样 去掉或替换 默认词库里的词?

DunkOnly
  • 612

现在我cut

我想看电视

结果是

我 想 看电视

看了下默认的词库里有 看电视 这个词。。

我想搞成

我 想 看 电视
回复
阅读 18.1k
3 个回答

jieba.add_word方法里目前还有个bug,
jieba主干已经修复了,但是旧版本可能会有
要把if freq改成if freq is not None
因为freq如果是0的话会有这个bug

jieba.add_word("看电视",0)#或者jieba.del_word("看电视")
jieba.add_word("看",100,"v")
jieba.add_word("电视",100,"n")

文档里说的很清楚了
调整词典

clipboard.png

你需要的功能:

clipboard.png

becauseofyoubob
  • 2
新手上路,请多包涵

把默认词库的‘看电视’删掉,加入‘看 3 nr’、‘电视 3 nr’,默认词库位置在安装目录下的lib/site-packages/jieba/下有一个dict.txt的文档,直接修改保存即可。最后记得删除jieba缓存文件后再运行程序(系统默认用户缓存应用程序的目录下,或者可以搜索jieba.cache文件删除)。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
宣传栏