使用 Python 读取/解析 Excel (xls) 文件

新手上路,请多包涵

使用 Python(不是 CSV 文件)读取 Excel (XLS) 文件的最佳方法是什么。

是否有 Python 默认支持的内置包来执行此任务?

原文由 qrbaQ 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 589
1 个回答

我强烈推荐 xlrd 阅读 .xls 文件。但是有一些限制(参考 xlrd github page ):

警告

此库将不再读取 .xls 文件以外的任何内容。有关读取较新文件格式的替代方法,请参阅 http://www.python-excel.org/

也不支持以下内容,但将安全可靠地忽略:

 - Charts, Macros, Pictures, any other embedded object, including embedded worksheets.
- VBA modules
- Formulas, but results of formula calculations are extracted.
- Comments
- Hyperlinks
- Autofilters, advanced filters, pivot tables, conditional formatting, data validation

此库不支持且无法读取受密码保护的文件。

voyager 提到了 COM 自动化的使用。几年前我自己做过,请注意,这样做是真正的 PITA。警告数量巨大,文档缺乏且令人讨厌。我遇到了许多奇怪的错误和陷阱,其中一些花了很多时间才弄清楚。

更新:

对于较新的 .xlsx 文件,推荐的读写库似乎是 openpyxl (感谢 Ikar Pohorský)。

原文由 taleinat 发布,翻译遵循 CC BY-SA 4.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题