用SAX解析XML:如何在xml中将html作为文本处理
我从外部服务器得到一个xml响应。
使用一些教程,我得到了SAX-Parser的工作。
还有一个小问题仍然存在。
在响应中有例如包含html这样的描述标签:
<description><p><strong>Title</strong></p>Description</description>
解析我的对象的描述字段后只包含“<”。
有没有可能告诉我的解析器将html处理为纯文本?
或者也许有其他可能性来解决这个问题。
谢谢。
既然你不包含你的代码,我不得不想象你写了什么。 SAX处理程序实现中的一个常见错误不是处理元素文本可能以多个字符()方法调用返回的事实。 您需要将它们聚合在一起,直到您收到endElement()事件。
除了解决方案SAX问题之外,您可能会考虑使用Stax(javax.xml.stream)解决方案:它的性能与SAX相同,但通常时间更方便一些。 您也可以强制合并文本内容(XMLInputFactory.IS_COALESCING)以避免像SAX遇到的问题。
链接地址: http://www.djcxy.com/p/34911.html上一篇: XML parsing with SAX: how to handle html as text within xml