sfe_x
  • 0
  • 新人请关照

SAX解析xlsx遇到workbook.xml和sheet.xml内容不规范,寻求好的解决方案,谢谢

我在使用sax解析xlsx格式excel文件的时候遇到workbook.xml和sheet.xml内容不正常的情况, 具体是这样的:
1.需求是获取excel中指定sheet数据,我计划是先解析workbook.xml中 <sheets>标签数据,比如:

<workbook ...>
...
  <sheets>
    <sheet name="测试Sheet" r:id="rId3" sheetId="1"/>
  </sheets>
</workbook>

根据这个workbook.xmlsheet标签内容,来获得r:id值,然后直接读取指定sheet文件流,但是发现有些r:idsheetId并不是准确一一对应的,例如上面的内容,实际excel只有一个sheet 测试Sheet 那么r:id值应该是rId1但是这里是rId3, 导致我不知道怎么去匹配sheet.
我一直没有找到合适的解决办法, 求助大家?

2.在sheet.xml文件中, 获取开始、结束列和行号也不准确, 例如出现这种:

<worksheet ...>
  <dimension ref="A1"/>
  ...
</worksheet>

正常情况下,标签<dimension 应该是 <dimension ref="A1:C15"/>这样的, 我原计划是打算通过这个来查找空单元格,现在我是通过解析cols标签来判断前中后是否有空单元格, 请问大家有什么好的解决办法处理这个问题?

上面表述可能比较繁琐, 但是没有找到更简洁明了的表述, 如果大家有什么疑问麻烦回复下我, 帮我看看这两个问题, 非常感谢大家!!!

阅读 140
评论 2019-12-06 提问
    撰写回答

    登录后参与交流、获取后续更新提醒