在PHP中解析无效HTML的最佳方法
有没有更好的方法来解析无效的HTML,然后在其上应用Tidy?
注意:有些情况下,您无法使用Tidy。 正则表达式也不推荐我理解为解析HTML。
我会尝试这样的:http://php.net/manual/en/domdocument.loadhtml.php
从该页面:
该函数分析字符串源中包含的HTML。 与加载XML不同, HTML不需要加载格式良好的HTML 。 这个函数也可以静态调用来加载和创建一个DOMDocument对象。
已知SimpleHTMLDOM比PHP的本地DOM功能更宽松。
链接地址: http://www.djcxy.com/p/5079.html上一篇: Best way to parse an invalid HTML in PHP
下一篇: PHP/Regex: simple regex for bbcode [s] or [strike] fails to work