pandas 重复行去除，列值合并怎么做？

cn_ak

21783855

发布于
2019-11-27

微信截图_20191127173401.png

city 列 chongqing 重复了，
但是population 列值比一样，
怎么可以做到合并一行，然后把population列两个不同的值存储到一个一列中？

pandas

阅读 12.6k

3 个回答

df.astype(str).groupby(['year','city'], as_index=False).agg(list).eval("population = population.str.join(',')")

joy钰

9k53031

发布于
2019-11-27

这样咩~

frame.groupby(['year', 'city'], sort=False)['population'].sum().reset_index()

   year       city  population
0  2016    Beijing        2100
1  2016   Shanghai        2300
2  2015  Guangzhou        1000
3  2017   Shenzhen         700
4  2016  Chongqing         300

夜雨雾深

281

发布于
2019-11-29


import pandas as pd

data = {'year':[2012,2013,2014,2015,2015],
        'city':['A','A','B','C','C'],
        'pop':[1,2,3,4,5]}

frame = pd.DataFrame(data,columns=['year','city','pop'])
groups = frame["pop"].groupby([frame["year"],frame["city"]])

year = []
city = []
pop = []

for i in groups:
    print(i)
    year.append(i[0][0])
    city.append(i[0][1])
    temp = []
    for j in i[1].values:
        temp.append(j)
    pop.append(temp)
        
d = {'a':year,'b':city,'c':pop}
da = pd.DataFrame(d)

print(da)

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

为什么pandas iloc()中使用df.iloc[[i][0]]会导致特定行为？
pandas中iloc()函数的参数问题我刚刚开始学习pandas，在一份代码中出现了df.iloc[[1][0]]（df是shape为(60935, 54)的pd.DataFrame数据类型）的调用，从代码上下文上理解df.iloc[[1][0]]应该是df的一行，但是应该如何理解[[1][0]]呢？为什么iloc[]中的参数会允许接受两个相邻的列表？iloc[]内部是如何处理的？这显然不是...
664 阅读

pandas 重复行去除，列值合并怎么做？

你尚未登录，登录后可以

为什么pandas iloc()中使用df.iloc[[i][0]]会导致特定行为？