假设有如下的多条数据:
佛山市威尔康乳胶制品有限公司
爱奥乐医疗器械(深圳)有限公司
...
现在如何判断这些数据中哪些是有效的企业注册名称,希望说下思路。
假设有如下的多条数据:
佛山市威尔康乳胶制品有限公司
爱奥乐医疗器械(深圳)有限公司
...
现在如何判断这些数据中哪些是有效的企业注册名称,希望说下思路。
这属于命名实体识别(NER),如果你只是想应用而已,直接import jieba
就行了。
如果是想具体学习原理,推荐论文NLP from scratch
2 回答5.1k 阅读✓ 已解决
2 回答1.1k 阅读✓ 已解决
4 回答966 阅读✓ 已解决
3 回答1.1k 阅读✓ 已解决
3 回答1.2k 阅读✓ 已解决
1 回答1.7k 阅读✓ 已解决
1 回答1.2k 阅读✓ 已解决
这样的工商信息最好是去工商网站看一下了,能不能查到,不过工商网站有查询限制,验证码什么的,自动化处理的话要注意下