今年共有2287名代表赴京开会.做了一个数据分析.效果如下图.其他也可以筛选出其他的,比如说姓xx的多少个,姓xx的多少个.我可以明确地告诉你,姓习的只有一个,那就是我习大大.

clipboard.png

准备工作:

获取所有代表信息这个是公开的,在百度百科可以找到.

数据分析

  1. 第一步将获取的所有代表信息字符串转换为数组
    可以使用match 也可以用split
    代码如下:

    clipboard.png

    我们得到一个2287长度的数组 如下:

       [0] => 乙晓光 
       [1] => 丁宁(女) 
       [2] => 丁琪(回族) 
       [3] => 丁小强 
       [4] => 丁业现 
       [5] => 丁向阳 
       [6] => 丁红都 
       [7] => 丁志峰 
       [8] => 丁来杭 
       [9] => 丁学东 
       [10] => 丁荣军 
       [11] => 丁唯秀(女) 
       [12] => 丁薛祥 
       [13] => 卜宪群 
       [14] => 乃依木·亚森(维吾尔族) 
       [15] => 于勇
       ...

    2.提取出姓名中的姓(少数民族的我取的是点号前面的 如 阿里巴巴·杰克马 我取阿里巴巴为姓)

    clipboard.png

    我们得到一个2287长度的数组 如下:

       [0] => 乙
       [1] => 丁 
       [2] => 丁
       [3] => 丁
       [4] => 丁
       [5] => 丁
       [6] => 丁
       [7] => 丁
       [8] => 丁
       [9] => 丁
       [10] => 丁
       [11] => 丁
       [12] => 丁 
       [13] => 卜 
       [14] => 乃依木 
       [15] => 于
       ...

    3.计算每个姓氏有多少人

    clipboard.png

    返回一个数组 如下:

       Array
       (
           [0] => 0
           [1] => Array
               (
                   [0] => 乙
                   [1] => 1
               )
       
           [2] => Array
               (
                   [0] => 丁
                   [1] => 12
               )
       
           [3] => Array
               (
                   [0] => 卜
                   [1] => 1
               )
       
           [4] => Array
               (
                   [0] => 乃依木
                   [1] => 1
               )
    
 4.对数据进行排序,按姓氏数量进行降序

clipboard.png

 5.统计女性和少数名族 只要对姓名进行一个正则判断
  

clipboard.png

 6.百分比 可以通过已有的数据计算得到 如(女性数量/总人数*100)

代码写得有点渣

预览代码
下载代码


buff
382 声望16 粉丝

i++;