"今天我去了跑步" 怎么提取 "今天" "跑步"
类似后台的文章关键字提取 .这个功能是怎么做到的?
看样子你提取的关键字不是权重(可理解为出现次数,引用次数等。这方面需求参考TF-IDF,topic-model,textrank等)。
你提取的好像是一个句子的概要,“今天”与“跑步”一个是发生时间,一个是动名词。
换句话说,你提取的是语义。就像语音助手一样能识别语义。
这部分算法我只知道通过机器学习的训练可以实现。参考https://www.zhihu.com/questio...
开源的组件上面 joinleft 已经说了,你可以搜索关键词 分词, topic-model, TF-IDF等
然后闭源的服务商也不少,直接百度 nlp 自然语言处理即可
15 回答8.1k 阅读
5 回答4.8k 阅读✓ 已解决
8 回答6.3k 阅读
4 回答4.4k 阅读✓ 已解决
1 回答3.1k 阅读✓ 已解决
4 回答3.8k 阅读✓ 已解决
4 回答2.5k 阅读✓ 已解决
使用分词组件。
盘古分词,结巴分词