python +django 开发网站。怎么根据内容或标题自动生成 tag 标签?不知道有什么思路没有?

python +django 开发网站。怎么根据内容或标题自动生成 tag 标签? 跟 V2EX 差不多,不知道有什么思路没有?

比如内容里有,某个省 市 县 镇 或者 某个名词
会自动生成一个相关的标签?

不知道有什么思路没有?

阅读 2.6k
2 个回答

可以使用elasticsearch+合适的中文分词器对题目进行分词,然后提取分词结果作为tag的候选项让用户选择。这样还可以根据标签检索相关的问题。如果要做到自动提取分词中的关键词,而抛弃非关键词,可能需要用上机器学习对分词样本进行训练,这方面我就不太了解了,抛转引个玉吧。

方案1.
用百度nlp 的文章标签接口
给你个入口

方案2
jieba文章标签提取方法
jieba.analyse.extract_tags(content, topK=5)
返回的是list
参考网站: 网站地址
需要需要自己完善语料库

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题