正则表达式去除链接
可能重复:
RegEx匹配除XHTML自包含标签之外的开放标签
我有一个HTML页面
<a class="development" href="[variable content]">X</a>
[可变内容]在每个地方都不相同,其余都是一样的。
什么正则表达式会捕获所有这些链接? (虽然我不是在这里写的,但我确实尝试了......)
那么非贪婪的版本呢?
<a class="development" href="(.*?)">X</a>
试试这个正则表达式:
<a class="development" href="[^"]*">X</a>
正则表达式在解析HTML时基本上是不好的(请参阅您能否提供一些例子,说明为什么很难用正则表达式解析XML和HTML?为什么)。 你需要的是一个HTML解析器。 请参阅您能否提供一个使用您最喜欢的解析器解析HTML的示例? 例如使用各种解析器。
链接地址: http://www.djcxy.com/p/76851.html上一篇: regular expression to remove links
下一篇: Regexp for html