对比excel，用python实现逆透视操作（宽表变长表）

大家好

最近看到群友们在讨论一个宽表变长表的问题，其实这类需求也很常见于我们日常的数据处理中。综合群友们的智慧，今天我们就来看看excel与python如何实现这个需求吧！

目录：

excel逆透视技巧
Pandas逆透视技巧

1. excel逆透视技巧

excel做逆透视操作是需要用到Power Query。

第一步：选中数据，然后在菜单栏-数据-点击来自表格/区域

选中数据-来自表格

第二步：创建表的时候，根据实际情况选中是否包含标题（本例不包含）

创建表

第三步：点击上述确认按钮后会出现Power Query编辑器

Power Query编辑器

第四步：按照control，选中全部需要操作的列（或者shift连续取列），再到转换-点击逆透视列

逆透视列

第五步：可以看到出现了我们需要的结果

逆透视结果

第六步：点击左上角文件，选中关闭并上载

上载数据

第七步：我们发现，在原始表出现了 表1的页签，里面正是我们期望的逆透视结果，搞定！（删掉无关列属性即可）

最终结果数据

2. Pandas逆透视技巧

我们要做的是透视的逆向操作，也就是逆透视，pandas自然也提供了非常方便的函数方法，让我们来一起看看吧。

隆重推荐 melt函数方法：

df.melt(
    id_vars=None,
    value_vars=None,
    var_name=None,
    value_name='value',
    col_level: 'Level | None' = None,
    ignore_index: 'bool' = True,
) -> 'DataFrame'
Docstring:
Unpivot a DataFrame from wide to long format, optionally leaving identifiers set.

id_vars ：tuple，list或ndarray（可选），用作标识变量的列
value_vars：tuple，列表或ndarray，可选，要取消透视的列。如果未指定，则使用未设置为id_vars的所有列
var_name：scalar，用于“变量”列的名称。如果为None，则使用frame.columns.name或“variable”
value_name：scalar，默认为“ value”，用于“ value”列的名称
col_level：int或str，可选，如果列是MultiIndex，则使用此级别来融化

就不举例了，直接拿案例数据开搞！

import pandas as pd
# 读取数据
df = pd.read_excel(r'0927测试数据.xlsx', header=None)
df

数据预览

# 直接逆透视
(
    df.melt(id_vars=df.columns[:2], # 标识变量的列
        value_vars=df.columns[2:], # 注释掉结果一样
        ignore_index=True, # 忽略索引
           )
    .sort_values(by=[0,1]) # 排序
    .dropna() # 删除含空值的行
)

结果

是不是很方便，直接一个函数即可搞定，感谢群成员 1px 提供的思路。

这种解决方案，笔者在之前给朋友处理过，不过看到这题的时候我居然用的是另外一种更复杂的解决方法，简直秀逗了。

我们也看看这种更麻烦的解决方案吧：

核心是explode爆炸列

data = df.iloc[:,:2].copy()
data

初始化data

# 辅助列用于存储店信息列表
data['辅助列'] = list(df.loc[:,2:].values)
data

辅助列存储店信息列表

# 爆炸列完成需求
data.explode(column='辅助列').dropna()

爆炸列完成需求

以上就是本次的全部内容，围绕着关于宽表转长表，也就是逆透视的操作。其实excel和pandas都提供了很简单直接的处理方法，大家熟悉操作后自然就能轻车熟路，高效解决问题啦。

不过，我们也可以通过其他一些思路来锻炼自己的逻辑思维能力，也许能更强化自己对复杂问题的应对水平哦！

对比excel，用python实现逆透视操作（宽表变长表）

1. excel逆透视技巧

2. Pandas逆透视技巧

码农向前冲

引用和评论

Python的就业方向有哪些？人工智能职位薪资是多少？

Anaconda安装教程以及Anaconda和pip配置国内镜像

如何减少跨团队交付摩擦？——基于 DevOps 与敏捷的最佳实践

pip安装报错：No such file or directory 'conda-forge' 没有那个文件或目录

科学计算编程涉及到的技术栈简介

Python 描述符

使用 chardet 判断文件编码需要注意的坑——过大的文件会导致高耗时