Python实用工具,PyQt5模块,Python实现根据中文姓名猜测对方性别

Cooci

前言:

利用贝叶斯公式,根据对方的中文姓名猜测对方的性别。废话不多说,让我们愉快地开始吧~

image.png

开发工具

Python版本:3.6.4

相关模块:

pyqt5模块;

以及一些python自带的模块。

环境搭建

安装Python并添加到环境变量,pip安装需要的相关模块即可。

原理简介

先来简单介绍一下贝叶斯公式吧,然后再来说代码实现。
我们都知道,事件A在事件B已经发生的条件下发生的概率为:

image.png

如果A和B是两个相互独立的事件,则有:

image.png
 

显然,我们可以利用上面的公式来判断两个事件是否独立。再来引入一下全概率公式(上标c代表补集):

image.png

上面的公式画个维恩图的话其实很好理解(图源网络):

图片

综合上面的结论,我们可以很容易地推出贝叶斯公式来:

image.png

实际应用到我们的姓名猜测性别中的话,其实就是求:

image.png

显然,我们有:

image.png

这里我们已知每个汉字在男性名字和女性名字中出现的频率:

图片

我们可以假设他们是独立的,例如:

 image.png

def genderprob(name, probs, type_='male'):
  assert type_ in ['male', 'female']
  if type_ == 'male':
    p = self.male_total / self.total
    for c in name:
      p *= probs.get(c, (0, 0))[0]
  else:
    p = self.female_total / self.total
    for c in name:
      p *= probs.get(c, (0, 0))[1]
  return p

还是以刘亦菲为例:

P(女性) = 女性姓名出现的次数 / 总出现次数
P(刘|女) = 刘在女性姓名中出现的次数 / 女性姓名出现的总次数

分母在做除法的时候可以约去,所以不用算,即:

male_prob = genderprob(name, self.name_probs, 'male')
female_prob = genderprob(name, self.name_probs, 'female')
result = {'male': male_prob / (male_prob + female_prob), 'female': female_prob / (male_prob + female_prob)}

然后利用PyQt5给这个姓名预测性别的小模型做个简单的可视化界面:

image.png

文章到这里就结束了,感谢你的观看,关注我每天分享Python小工具系列,下篇文章分享自动生成艺术签名的小工具

为了感谢读者们,我想把我最近收藏的一些编程干货分享给大家,回馈每一个读者,希望能帮到你们。

干货主要有:

① 2000多本Python电子书(主流和经典的书籍应该都有了)

② Python标准库资料(最全中文版)

③ 项目源码(四五十个有趣且经典的练手项目及源码)

④ Python基础入门、爬虫、web开发、大数据分析方面的视频(适合小白学习)

⑤ Python学习路线图(告别不入流的学习)

⑥ 两天的Python爬虫训练营直播权限

All done~完整源代码+干货详见个人简介或者私信获取相关文件。。

阅读 312

Python实训营直播预约:[链接]

372 声望
36 粉丝
0 条评论

Python实训营直播预约:[链接]

372 声望
36 粉丝
文章目录
宣传栏