最近有一个需求需要从上传文件中的指定位置读取内容,以前没有写过这种功能不知道该怎么办,希望给我点提示
场景:我需要从一个上传的.doc文件中读取指定位置文本框中的内容
示例:比如我需要获取图片中所示的文本框中的内容
我需要怎样做才能准确的获取到文本框中的内容呢? 并且一个文件中包含多个类似的文本框需要读取,我该怎么做呢?
最近有一个需求需要从上传文件中的指定位置读取内容,以前没有写过这种功能不知道该怎么办,希望给我点提示
场景:我需要从一个上传的.doc文件中读取指定位置文本框中的内容
示例:比如我需要获取图片中所示的文本框中的内容
我需要怎样做才能准确的获取到文本框中的内容呢? 并且一个文件中包含多个类似的文本框需要读取,我该怎么做呢?
8 回答6.4k 阅读
3 回答3.7k 阅读✓ 已解决
1 回答4.2k 阅读✓ 已解决
3 回答2.7k 阅读✓ 已解决
3 回答2.3k 阅读✓ 已解决
2 回答3.2k 阅读
2 回答3.9k 阅读
个人感觉类似
poi
类库之类的,可以获取整个文本然后按照一定的规则正则匹配,或者是这个文本框有个特殊的格式能标识出来才能获取到。然后就是可以考虑转换成
pdf
,用pdfbox
类似的库,也和直接解析word
差不多,但是多了个按照位置获取的方法。没怎么实际处理过,上面只是一些猜想