在Php中的HTML刮

这个问题在这里已经有了答案:

  • 如何解析和处理PHP中的HTML / XML? 28个答案

  • 在从页面中获取HTML后,我会推荐PHP Simple HTML DOM Parser。 它支持无效的HTML,并提供了一种处理HTML元素的非常简单的方法。


    如果您正在抓取的页面是有效的X(HT)ML,那么任何PHP的内置XML解析器都会执行。

    我并没有在PHP库中取得很多成功。 如果你冒险,但你可以尝试simplehtmldom。 我建议使用Hpricot for Ruby或美丽的汤来使用Python,它们都是HTML的优秀解析器。


    我还会推荐'Simple HTML DOM Parser'。 这是一个很好的选择,特别是如果你熟悉jQuery或JavaScript选择器,那么你会发现自己在家里。

    过去我甚至在博客上做过博客。

    链接地址: http://www.djcxy.com/p/29891.html

    上一篇: HTML Scraping in Php

    下一篇: PHP Parse HTML code