使用PHP的DOM提取Scraped页面的HTML

是否有可能通过已经通过PHP的DOM工具(例如$ div = $ dom-> getElementsByTagName('table') - > item(0);)提取的HTML代码片段的内容创建HTML输出,以便创建HTML只包含具有指定标签名称的元素及其后代?

否则,有没有其他方法可以从页面的完整HTML中轻松提取HTML代码片段? 我只想提取我所抓取页面的第一张表格,并只显示该表格及其内容。


是的,您可以将节点传递给DOMDocument::saveXML()

echo $dom->saveXml($div);

然后它会给你节点的outerHTML

链接地址: http://www.djcxy.com/p/92669.html

上一篇: Extract HTML of a Scraped Page Using PHP's DOM

下一篇: html scraping and css queries