今年共有2287名代表赴京开会.做了一个数据分析.效果如下图.其他也可以筛选出其他的,比如说姓xx的多少个,姓xx的多少个.我可以明确地告诉你,姓习的只有一个,那就是我习大大.
准备工作:
获取所有代表信息这个是公开的,在百度百科可以找到.
数据分析
-
第一步将获取的所有代表信息字符串转换为数组
可以使用match 也可以用split
代码如下:我们得到一个2287长度的数组 如下:
[0] => 乙晓光 [1] => 丁宁(女) [2] => 丁琪(回族) [3] => 丁小强 [4] => 丁业现 [5] => 丁向阳 [6] => 丁红都 [7] => 丁志峰 [8] => 丁来杭 [9] => 丁学东 [10] => 丁荣军 [11] => 丁唯秀(女) [12] => 丁薛祥 [13] => 卜宪群 [14] => 乃依木·亚森(维吾尔族) [15] => 于勇 ...
2.提取出姓名中的姓(少数民族的我取的是点号前面的 如 阿里巴巴·杰克马 我取阿里巴巴为姓)
我们得到一个2287长度的数组 如下:
[0] => 乙 [1] => 丁 [2] => 丁 [3] => 丁 [4] => 丁 [5] => 丁 [6] => 丁 [7] => 丁 [8] => 丁 [9] => 丁 [10] => 丁 [11] => 丁 [12] => 丁 [13] => 卜 [14] => 乃依木 [15] => 于 ...
3.计算每个姓氏有多少人
返回一个数组 如下:
Array ( [0] => 0 [1] => Array ( [0] => 乙 [1] => 1 ) [2] => Array ( [0] => 丁 [1] => 12 ) [3] => Array ( [0] => 卜 [1] => 1 ) [4] => Array ( [0] => 乃依木 [1] => 1 )
4.对数据进行排序,按姓氏数量进行降序
5.统计女性和少数名族 只要对姓名进行一个正则判断
6.百分比 可以通过已有的数据计算得到 如(女性数量/总人数*100)
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。