如何使用贝叶斯方法识别1个文本中的内容是姓名?

假设有这样1个文本:

张三
李四
田七
赵圆圆
赵又廷
...

现在打算使用贝叶斯方法来对上述文本进行识别,识别其内容为姓名,那么如何实现呢?可以提供思路、文章链接或相应的代码。
如果使用的是skcit-learn如何进行训练?

阅读 4.2k
2 个回答

要识别什么?你的意思是通过判断汉字识别是否为姓名?
要是这样的话就是分类问题,要有训练样本,把所有姓氏都定为特征项,但是太多了啊,暂时没想到别的

首先你得先把姓和名分开,乃义务贝叶斯可以简单的理解为在A发生的情况下B发生的概率。
分开之后我想你也应该会做了吧~

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题