在PHP中解析无效HTML的最佳方法

有没有更好的方法来解析无效的HTML,然后在其上应用Tidy?

注意:有些情况下,您无法使用Tidy。 正则表达式也不推荐我理解为解析HTML。


我会尝试这样的:http://php.net/manual/en/domdocument.loadhtml.php

从该页面:

该函数分析字符串源中包含的HTML。 与加载XML不同, HTML不需要加载格式良好的HTML 。 这个函数也可以静态调用来加载和创建一个DOMDocument对象。


已知SimpleHTMLDOM比PHP的本地DOM功能更宽松。

链接地址: http://www.djcxy.com/p/5079.html

上一篇: Best way to parse an invalid HTML in PHP

下一篇: PHP/Regex: simple regex for bbcode [s] or [strike] fails to work