在 GAE 上解析完全有效的 XML 时，“prolog 中不允许有内容”

在过去的 48 小时里，我一直在为这个绝对令人愤怒的错误而努力，所以我想我最终会认输并尝试在这里询问，然后再将笔记本电脑扔出窗外。

我正在尝试解析来自我对 AWS SimpleDB 的调用的响应 XML。响应很好地回到了网络上。例如，它可能看起来像：

 <?xml version="1.0" encoding="utf-8"?>
<ListDomainsResponse xmlns="http://sdb.amazonaws.com/doc/2009-04-15/">
    <ListDomainsResult>
        <DomainName>Audio</DomainName>
        <DomainName>Course</DomainName>
        <DomainName>DocumentContents</DomainName>
        <DomainName>LectureSet</DomainName>
        <DomainName>MetaData</DomainName>
        <DomainName>Professors</DomainName>
        <DomainName>Tag</DomainName>
    </ListDomainsResult>
    <ResponseMetadata>
        <RequestId>42330b4a-e134-6aec-e62a-5869ac2b4575</RequestId>
        <BoxUsage>0.0000071759</BoxUsage>
    </ResponseMetadata>
</ListDomainsResponse>

我将此 XML 传递给解析器

XMLEventReader eventReader = xmlInputFactory.createXMLEventReader(response.getContent());

并多次调用 eventReader.nextEvent(); 来获取我想要的数据。

这是奇怪的部分——它在本地服务器中运行良好。响应进来了，我解析一下，大家都很开心。问题是，当我将代码部署到 Google App Engine 时，传出请求仍然有效，响应 XML 对我来说似乎 100% 相同且正确，但响应无法解析，并出现以下异常：

 com.amazonaws.http.HttpClient handleResponse: Unable to unmarshall response (ParseError at [row,col]:[1,1]
Message: Content is not allowed in prolog.): <?xml version="1.0" encoding="utf-8"?>
<ListDomainsResponse xmlns="http://sdb.amazonaws.com/doc/2009-04-15/"><ListDomainsResult><DomainName>Audio</DomainName><DomainName>Course</DomainName><DomainName>DocumentContents</DomainName><DomainName>LectureSet</DomainName><DomainName>MetaData</DomainName><DomainName>Professors</DomainName><DomainName>Tag</DomainName></ListDomainsResult><ResponseMetadata><RequestId>42330b4a-e134-6aec-e62a-5869ac2b4575</RequestId><BoxUsage>0.0000071759</BoxUsage></ResponseMetadata></ListDomainsResponse>
javax.xml.stream.XMLStreamException: ParseError at [row,col]:[1,1]
Message: Content is not allowed in prolog.
    at com.sun.org.apache.xerces.internal.impl.XMLStreamReaderImpl.next(Unknown Source)
    at com.sun.xml.internal.stream.XMLEventReaderImpl.nextEvent(Unknown Source)
    at com.amazonaws.transform.StaxUnmarshallerContext.nextEvent(StaxUnmarshallerContext.java:153)
    ... (rest of lines omitted)

我对这个 XML 进行了双重、三重、四重检查，以查找“不可见字符”或非 UTF8 编码字符等。我在数组中逐字节查看字节顺序标记或类似性质的东西。没有什么;它通过了我可以进行的所有验证测试。更奇怪的是，如果我也使用基于 Saxon 的解析器，也会发生这种情况——但仅在 GAE 上，它在我的本地环境中总是可以正常工作。

当我只能在完美运行的环境中运行调试器时（我还没有找到任何在 GAE 上远程调试的好方法），很难跟踪代码中的问题。尽管如此，使用我拥有的原始方法，我已经尝试了一百万种方法，包括：

带和不带序言的 XML
有和没有换行符
序言中带有和不带有“encoding=”属性
两种换行样式
HTTP 流中存在和不存在分块信息的情况

而且我已经在多种组合中尝试了其中的大多数，它们会交互是有意义的——没有！我无计可施。有没有人在此之前看到过这样的问题，希望能对此有所了解？

谢谢！

原文由 Adrian Petrescu 发布，翻译遵循 CC BY-SA 4.0 许可协议

阅读 783

在 GAE 上解析完全有效的 XML 时，“prolog 中不允许有内容”

你尚未登录，登录后可以

Java 开发 URL 匹配问题？

诺依框架自动生成代码前端Vue3提交数据，后端Java没收到问题出在哪里？

WSL里的Ubuntu系统开发Spring Boot报错Project build error: Non-readable POM ？

请问是否有什么方案实现不同用户之间本地数据库的同步呢？

MyBatis Plus 如何对敏感字段加解密（使用哪种加密方式）？

一个类实现接口并且继承父类使用Spring aop 失效?

idea 中有很多个 yml配置文件 , 如果想查找 a.b.c.d.e属性有什么好的办法吗?

Stack Overflow 翻译

在 GAE 上解析完全有效的 XML 时，“prolog 中不允许有内容”

你尚未登录，登录后可以

Java 开发 URL 匹配问题？

诺依框架自动生成代码前端Vue3提交数据，后端Java没收到问题出在哪里？

WSL里的Ubuntu系统开发Spring Boot报错Project build error: Non-readable POM ？

请问是否有什么方案实现不同用户之间本地数据库的同步呢？

MyBatis Plus 如何对敏感字段加解密（使用哪种加密方式）？

一个类实现接口并且继承父类 使用Spring aop 失效?

idea 中 有很多个 yml配置文件 , 如果想查找 a.b.c.d.e属性 有什么好的办法吗?

Stack Overflow 翻译

一个类实现接口并且继承父类使用Spring aop 失效?

idea 中有很多个 yml配置文件 , 如果想查找 a.b.c.d.e属性有什么好的办法吗?