python - PANDAS & glob - 无法确定 Excel 文件格式，您必须手动指定引擎？

PANDAS & glob - 无法确定 Excel 文件格式，您必须手动指定引擎？

代码可以正常运行，但是会出现有以下错误：

Excel file format cannot be determined, you must specify an engine manually.

下面是我的代码和操作流程：

1- 列表中客户列的ID：

 customer_id = ["ID","customer_id","consumer_number","cus_id","client_ID"]

2- 在文件夹中查找所有 xlsx 文件并读取它们的代码：

 l = [] #use a list and concat later, faster than append in the loop
for f in glob.glob("./*.xlsx"):
    df = pd.read_excel(f).reindex(columns=customer_id).dropna(how='all', axis=1)
    df.columns = ["ID"] # to have only one column once concat
    l.append(df)
all_data  = pd.concat(l, ignore_index=True) # concat all data

我添加了引擎 openpyxl

df = pd.read_excel(f, engine="openpyxl").reindex(columns = customer_id).dropna(how='all', axis=1)

新的错误提示：

 BadZipFile: File is not a zip file

pandas 版本：1.3.0
python 版本：python3.9
操作系统：MacOS

有没有更好的方法从文件夹中读取所有 xlsx 文件？

原文由 MTALY 发布，翻译遵循 CC BY-SA 4.0 许可协议

阅读 9.2k

if file_extension == 'xlsx': df = pd.read_excel(file.read(), engine='openpyxl') elif file_extension == 'xls': df = pd.read_excel(file.read()) elif file_extension == 'csv': df = pd.read_csv(file.read())

PANDAS & glob - 无法确定 Excel 文件格式，您必须手动指定引擎？

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？

Stack Overflow 翻译