通过在正则表达式中使用括号可以创建 “ 分组 ” ,比如这个正则表达式 (\d\d\d)-(\d\d\d-\d\d\d\d) 利用括号,创建了两个分组。
1 group() 方法
可以使用 group() 方法,从一个分组中获取所匹配的文本。
传入整数 1 或 2, 就可以取得匹配文本的不同部分。 向 group() 方法传入 0 或不传入参数,将返回整个匹配的文本。
phone_num_regex=re.compile(r'(\d\d\d\d)-(\d\d\d\d\d\d\d\d)') mo=phone_num_regex.search('我的联系号码为: 0591-83822032.') print(mo.group()) print(mo.group(0)) print(mo.group(1)) print(mo.group(2))
运行结果:
0591-83822032
0591-83822032
0591
83822032
2 groups() 方法
可以使用 groups() 方法,一次性获取所有的分组。
print(mo.groups()) area_code, num = mo.groups() print('area_code=' + area_code) print('num=' + num)
运行结果:
(‘0591’, ‘83822032’)
area_code=0591
num=83822032
groups() 会返回包含多个值的元组,所以我们可以使用多重复制技巧,把每个值赋给一个变量,就像前面的示例所展示的那样:area_code, num = mo.groups()
3 匹配括号
如果需要在文本中匹配括号, 那么需要使用倒斜杠对 ( 和 ) 进行字符转义。
phone_num_regex = re.compile(r'(\(\d\d\d\d\))-\d\d\d\d\d\d\d\d') mo = phone_num_regex.search('我的联系号码为: (0591)-83822032.') print(mo.group(1))
运行结果:
(0591)