Nexpose XML报告2.0版,如何从XML中删除HTML?
我为Nxpose的XML版本2.0制作了PHP的PHP解析器,它工作正常,但最近解析器失败。
这个问题似乎是因为我试图解析的XML在XML元素之间没有CDATA标记,这意味着HTML代码具有无效字符。 所以XML无法解析我正在使用的库,xmlReader和simpleXML。
这是一个对于这个PHP的DOM库无效的行的例子:
<Paragraph preformat="true">98: 99: <BODY scroll="AUTO" bgColor="#FFFFFF" text="#000000" onload="setFo... 100: <FORM action="/exchweb/bin/auth/owaauth.dll" method="POST" name="... 101: 98: <INPUT type="hidden" name="destination" value="
http://www.rapid7.com"...</Paragraph>
任何想法如何检测像这样的所有行并删除它?
现在我发现的唯一模式是在HTML代码编号为具有以下模式的标识符之前的帽子:
<number>:<html-code>
预先感谢您的帮助球员。
亲切的问候
你应该试试这个:
<Paragraph.+[0-9]:.+</Paragraph>
链接地址: http://www.djcxy.com/p/64751.html
上一篇: Nexpose XML report Version 2.0, How to remove HTML from XML?