python RE的match()和group()疑问
在
http://docs.python.org/library/re.htm...
看到
m = re.match(r"(..)+", "a1b2c3") # Matches 3 times. m.group(1) # Returns only the last match. 'c3' m.group(0) 'a1b2c3' m.groups() ('c3',)
注意到pattern中的+,应该是匹配偶数个字符.
1.首先是match的问题.match是从开头匹配,为什么会匹配到c3呢?
2.group(0)是整个匹配项,为什么groups()中没有呢?
老湿不给力阿
11 years, 8 months ago
Answers
1) 从group的角度考虑,整个表达式应该写作((..)+)。所以最高一层group(0)匹配整个字符串。
2) 先说第二个问题,按照文档的描述的行为,group()是列出从编号1开始的所有group,而给定的表达式只有一个group,所以自然就是c3了
3) 好,最后是为什么group(1)是c3。如果你的正则表达式没有那个“+”,那么它就只匹配a1。而有了“+”之后,每匹配到一个“(..)”就会放到group(1)中。所以跑完整个字符串,group(1)就存进了c3
我猜你其实想问“字符串中明明有三个符合(..)的,但为什么只出现了最后一个呢?”原因是,group说的是正则表达式中的括号,而不是字符串中符合括号内pattern的子串。
eiloi
answered 11 years, 8 months ago