在Php中的HTML刮
这个问题在这里已经有了答案:
在从页面中获取HTML后,我会推荐PHP Simple HTML DOM Parser。 它支持无效的HTML,并提供了一种处理HTML元素的非常简单的方法。
如果您正在抓取的页面是有效的X(HT)ML,那么任何PHP的内置XML解析器都会执行。
我并没有在PHP库中取得很多成功。 如果你冒险,但你可以尝试simplehtmldom。 我建议使用Hpricot for Ruby或美丽的汤来使用Python,它们都是HTML的优秀解析器。
我还会推荐'Simple HTML DOM Parser'。 这是一个很好的选择,特别是如果你熟悉jQuery或JavaScript选择器,那么你会发现自己在家里。
过去我甚至在博客上做过博客。
链接地址: http://www.djcxy.com/p/29891.html上一篇: HTML Scraping in Php
下一篇: PHP Parse HTML code