正则匹配url提取
匹配url提取,从昨晚到现在才搞明白,记下来省得忘掉
$reg = “#<a[^>]+href=(['\"])(.+)[\1\s]#isU”;
# 表示开始结束,没什么意义。
<a 匹配链接开始特征
[^>] 不等于>的任何字符
- 匹配前面的子表达式一次或多次
href= 匹配链接特征
['\"] []表示包含其中的任意一个字符,包含“’”或者“””
(.+) .表示任意一个非换行的字符,+匹配前面的子表达式一次或多次
\1 表示逆向引用子模式1,在这个例子也就是引用 ['\"]
\s 表示空格
i 正则修正符,大小写不敏感
s 正则修正符,多行,即忽略换行
U 非贪婪模式
Droid
12 years, 7 months ago