问题描述
使用python提取内容未知的excel表格中子表格
类似图片的红框部分,如何在读取excel表格的之后,根据提前配置的关键字,完成对红色部分的子表的提取。
使用python提取内容未知的excel表格中子表格
类似图片的红框部分,如何在读取excel表格的之后,根据提前配置的关键字,完成对红色部分的子表的提取。
示例数据:
假设你是想获取“用户填写”和“公司填写”之间的数据。
import pandas as pd
df = pd.read_excel("test.xlsx")
target_index = df.iloc[:,0].isin(["用户填写", "公司填写"]).index
res = df.iloc[target_index[0]:target_index[1],:]
res = res.rename(columns=res.iloc[0]).drop(res.index[0])
结果:
Out[42]:
0 用户填写 col1 col2 col3
1 NaN NaN NaN NaN
2 NaN NaN NaN NaN
3 NaN NaN NaN NaN
4 NaN NaN NaN NaN
4 回答4.5k 阅读✓ 已解决
1 回答3.4k 阅读✓ 已解决
4 回答3.9k 阅读✓ 已解决
3 回答2.2k 阅读✓ 已解决
1 回答4.6k 阅读✓ 已解决
2 回答514 阅读✓ 已解决
3 回答4.1k 阅读
数据表格
相关读取代码
执行结果