POI读取word内容的疑问

违禁昵称
  • 278

两片内容相同的word,poi分割成XWPFRun集合的时候,发现相同的段落内容有空行。

图片描述

word1打印的段落内容

图片描述

word2打印的段落内容

图片描述

代码如下

/**
  替换段落中的内容
  @param paragraphList  段落集合
  @param param          要替换的内容map集合
  @param doc            CustomXWPFDocument对象
 */
    public static void processParagraphs(List<XWPFParagraph> paragraphList,Map<String, Object> param,CustomXWPFDocument doc){
    if(paragraphList != null && paragraphList.size() > 0){
        for(XWPFParagraph paragraph:paragraphList){
            List<XWPFRun> runs = paragraph.getRuns();  //段落集合
            for (XWPFRun run : runs) {
                String text = run.getText(0);          //段落内容                                                             
                System.out.println("text---->"+text);
                if(text != null){
                    boolean isSetText = false;
                    for (Entry<String, Object> entry : param.entrySet()) {
                        String key = entry.getKey();
                        if(text.indexOf(key) != -1){
                            isSetText = true;
                            Object value = entry.getValue();
                            if (value instanceof String) {//文本替换
                                text = text.replace(key, value.toString());                                         
                                break;
                            }
                        }
                    }
                    if(isSetText){
                        run.setText(text,0);
                    }
                }
            }
        }
    }
}

造成两次段落内容分割不同的情况我大致知道,word2每一行纯手打,word1复制过来的。但是有时候纯手打也会出现一个替换字符分行,或者多个替换字符在一行的情况。例如${AAA}${BBB} 被解析成了一个段落。

图片描述

求大神,这个问题困惑了很久。

回复
阅读 4.7k
3 个回答
qianyu
  • 1
新手上路,请多包涵

这个问题我也有遇到过,后来放弃使用XWPFRun了,换用别的方法

jerrygaoc
  • 3
新手上路,请多包涵

其实可以用另一种思路来做,就是先把para的text取出来,遍历map,把text里该替换的全部替换好,然后把runs里前面所有的text都换成空,把最后一个run的text换成替换后的para的text 就ok了

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
宣传栏