Nexpose XML报告2.0版,如何从XML中删除HTML?

我为Nxpose的XML版本2.0制作了PHP的PHP解析器,它工作正常,但最近解析器失败。

这个问题似乎是因为我试图解析的XML在XML元素之间没有CDATA标记,这意味着HTML代码具有无效字符。 所以XML无法解析我正在使用的库,xmlReader和simpleXML。

这是一个对于这个PHP的DOM库无效的行的例子:

<Paragraph preformat="true">98: 99: <BODY scroll="AUTO" bgColor="#FFFFFF" text="#000000" onload="setFo... 100: <FORM action="/exchweb/bin/auth/owaauth.dll" method="POST" name="... 101: 98: <INPUT type="hidden" name="destination" value="
http://www.rapid7.com"...</Paragraph>

任何想法如何检测像这样的所有行并删除它?

现在我发现的唯一模式是在HTML代码编号为具有以下模式的标识符之前的帽子:

<number>:<html-code>

预先感谢您的帮助球员。

亲切的问候


你应该试试这个:

<Paragraph.+[0-9]:.+</Paragraph>
链接地址: http://www.djcxy.com/p/64751.html

上一篇: Nexpose XML report Version 2.0, How to remove HTML from XML?

下一篇: PHP: How to replace existing XML node with XMLWriter