正则表达式去除链接

可能重复:
RegEx匹配除XHTML自包含标签之外的开放标签

我有一个HTML页面

<a class="development" href="[variable content]">X</a>

[可变内容]在每个地方都不相同,其余都是一样的。
什么正则表达式会捕获所有这些链接? (虽然我不是在这里写的,但我确实尝试了......)


那么非贪婪的版本呢?

<a class="development" href="(.*?)">X</a>

试试这个正则表达式:

<a class="development" href="[^"]*">X</a>

正则表达式在解析HTML时基本上是不好的(请参阅您能否提供一些例子,说明为什么很难用正则表达式解析XML和HTML?为什么)。 你需要的是一个HTML解析器。 请参阅您能否提供一个使用您最喜欢的解析器解析HTML的示例? 例如使用各种解析器。

链接地址: http://www.djcxy.com/p/76851.html

上一篇: regular expression to remove links

下一篇: Regexp for html