Python正则表达式
正则表达式在Python中通过import re模块使用,最早在python 1.5版本已经加入.下文主要通过实例介绍正则表达式用法.
操作方法
- 01
正则表达式常用的元字符如下所示: .:匹配任何一个字符; ^:匹配除去所列首个字符外的所有字符; $:匹配字符串的尾部字符
- 02
*:表示匹配0个或者多个字符 +:表示匹配1个或者多个字符 ?:表示匹配0个或者1个字符,如图中用例所示:
- 03
*?,+?,??:匹配满足要求的最短字符串; {m}:匹配m个相同的字符; {m,n}:匹配m到n个相同的字符;
- 04
{m,n}?:匹配m到n个相同的字符(非贪婪算法,匹配最短字符); \:转义字符,如果字符串不用r限定,遇到特殊字符需要进行转义; []:满足匹配字符串的集合; |:如A|B,或的关系,满足A或者B,表达式都为真;
- 05
(?=...):如果字符串后面的字符和...相匹配,则整个表达式返回真,否则失败; (?!...):和前者相反,如果字符串后面的字符和...不匹配,则整个表达式返回真
- 06
(?<=...):如果在字符串找到和()后面相同的字符,继续回退字符看是否和<=后面的字符是否一样,如是则表达式返回真. (?!=...):如果在字符串找到和()后面相同的字符,继续回退字符看是否和<=后面的字符是否一样,如是则表达式返回失败.
- 07
\number:反斜杠后面加数据,匹配number个字符串个数. \A:匹配字符串开始; \b:匹配空格字符; \B:匹配除了空格字符以外的字符;
- 08
\d:匹配任意数字; \D:匹配除了数字以外的字符; \w:匹配字符和下划线; \W:匹配除了字符和下划线以外的字符.
赞 (0)