Nexpose XML报告2.0版，如何从XML中删除HTML？

2018-06-23 02:11:45

我为Nxpose的XML版本2.0制作了PHP的PHP解析器，它工作正常，但最近解析器失败。

这个问题似乎是因为我试图解析的XML在XML元素之间没有CDATA标记，这意味着HTML代码具有无效字符。所以XML无法解析我正在使用的库，xmlReader和simpleXML。

这是一个对于这个PHP的DOM库无效的行的例子：

<Paragraph preformat="true">98: 99: <BODY scroll="AUTO" bgColor="#FFFFFF" text="#000000" onload="setFo... 100: <FORM action="/exchweb/bin/auth/owaauth.dll" method="POST" name="... 101: 98: <INPUT type="hidden" name="destination" value="
http://www.rapid7.com"...</Paragraph>

任何想法如何检测像这样的所有行并删除它？

现在我发现的唯一模式是在HTML代码编号为具有以下模式的标识符之前的帽子：

<number>:<html-code>

预先感谢您的帮助球员。

亲切的问候

你应该试试这个：

<Paragraph.+[0-9]:.+</Paragraph>

链接地址: http://www.djcxy.com/p/64751.html

上一篇: Nexpose XML report Version 2.0, How to remove HTML from XML?

下一篇: PHP: How to replace existing XML node with XMLWriter