- Charts, Macros, Pictures, any other embedded object, including embedded worksheets.
- VBA modules
- Formulas, but results of formula calculations are extracted.
- Comments
- Hyperlinks
- Autofilters, advanced filters, pivot tables, conditional formatting, data validation
此库不支持且无法读取受密码保护的文件。
voyager 提到了 COM 自动化的使用。几年前我自己做过,请注意,这样做是真正的 PITA。警告数量巨大,文档缺乏且令人讨厌。我遇到了许多奇怪的错误和陷阱,其中一些花了很多时间才弄清楚。
我强烈推荐 xlrd 阅读
.xls
文件。但是有一些限制(参考 xlrd github page ):voyager 提到了 COM 自动化的使用。几年前我自己做过,请注意,这样做是真正的 PITA。警告数量巨大,文档缺乏且令人讨厌。我遇到了许多奇怪的错误和陷阱,其中一些花了很多时间才弄清楚。
更新:
对于较新的
.xlsx
文件,推荐的读写库似乎是 openpyxl (感谢 Ikar Pohorský)。