pandas 分组合并字段(qbit)

前言

  • 环境

    Python 3.8
    Pandas 1.4.4

正文

  • 初始化数据

    >>> df0 = pd.DataFrame(data={
               'name': ['王二', '王二', '张三'],
               'tag': ['足球', '电影', '跑步'],
               'title': ['舅舅', 'uncle', 'man']
           })
    
    >>> df0
    name    tag   title
     0   王二  足球    舅舅
     1   王二  电影    uncle
     2   张三  跑步    man
  • 单字段合并

    >>> df = df0.groupby('name')['tag'].apply(lambda x: ';'.join(x)).reset_index()
    >>> df
    name    tag
     0   张三     跑步
     1   王二  足球;电影
  • 多字段合并

    >>> def combine(x: pd.DataFrame):
           ser = pd.Series({
               'tag': ';'.join(x['tag']),
               'title': ';'.join(x['title']).upper()
           })
           return ser
      
    
    >>> df = df0.groupby('name').apply(combine).reset_index()
    >>> df
    name    tag     title
     0   张三     跑步       MAN
     1   王二  足球;电影  舅舅;UNCLE
本文出自 qbit snap

qbit snap
开箱即用,拿走不谢。
262 声望
275 粉丝
0 条评论
推荐阅读
Windows 下多版本 Python 共享 Poetry(qbit)
前言技术栈 {代码...} Python 3.8 安装目录 {代码...} Python 3.11 安装目录 {代码...} 安装 poetry设置将以下路径加入 path 环境变量 {代码...} 复制文件 {代码...} 设置 pip 国内镜像源 {代码...} 升级 pip {代...

qbit阅读 235

jumpserver api创建资产
jumpserver apidomain+/api/docspython {代码...} GO {代码...}

台湾省委书记阅读 642

封面图
基于OpenCV的人脸、视频、文字检测以及识别的项目(一 项目准备)
numpy是一个定义了数值数组和矩阵类型和它们的基本运算的语言扩展,OpenCV引用了numpy模块,所以安装OpenCV之前必须安装numpy。numpy:第一步:先去网站下载对应的numpy版本,这个numpy要对应你的python版本号 下...

胡子老爷爷阅读 532

人工智能AI聊天ChatGPT新接口模型gpt-3.5-turbo闪电更新,成本降90%,Python3.10接入
北国春迟,春寒料峭略带阴霾,但ChatGPT新接口模型gpt-3.5-turbo的更新为我们带来了一丝暖意,使用成本更加亲民,比高端产品ChatGPT Plus更实惠也更方便,毕竟ChatGPT Plus依然是通过网页端来输出,Api接口是以to...

刘悦的技术博客阅读 455

封面图
影片自由,丝滑流畅,Docker容器基于WebDav协议通过Alist挂载(百度网盘/阿里云盘)Python3.10接入
使用过NAS(Network Attached Storage)的朋友都知道,它可以通过局域网将本地硬盘转换为局域网内的“网盘”,简单理解就是搭建自己的“私有云”,但是硬件和网络成本都太高了,有点可望而不可及的意思。Alist开源库则...

刘悦的技术博客阅读 454

封面图
如何创建一个超时后不会被kill的python子进程
在subprocess之前,创建一个新进程的方式有很多种,如os.system()、os.spawn*方法等。为了统一创建进程的方式,python社区提议使用subprocess模块作为创建进程的标准方式,用来替换os.system和os.spawn*等方式。

namedlock阅读 363

python 获取Azure 下的虚拟机列表
事实上,微软Azure并没有一个所谓的“API访问凭证”的概念,我们需要通过它的“Active Directory”中的应用程序Client信息来进行API的访问。而且相较其它云厂商而言,微软Azure的API访问凭证略显复杂,且需要通过多个...

台湾省委书记阅读 310

封面图
262 声望
275 粉丝
宣传栏