Python 正则表达式

什么是正则表达式

正则表达式(Regular Expression,简称RE),是由一些具有特殊意义的符号+常规的字符组成的表达式,用于对字符串进行搜索或者匹配。


正则表达式的性质

  • 可连接:如果AB都是正则表达式,那么AB也是正则表达式。
  • 在Python中,支持Unicode8-bit字符串的搜索,但两者不可以混合。
  • 在Python中,反斜杠\用于指示特殊的字符。
  • 同时包含普通的字符和特殊的字符

普通字符


如字母(AaBb……等)、数字(0123……等)等,这类字符只它们本身匹配。


特殊字符

|(这样的字符则属于特殊字符,它们可以代表普通字符的类型,也可以影响周围的正则表达式的含义/解读。

重复修饰符(如*+?{m,n}等)不可以直接嵌套。以免与非-greedy修饰符?或其他实现的修饰符产生歧义。要在重复的内部使用第二次重复,可以使用圆括号(),比如(?:a{6})*可以匹配任意6的倍数个'a'






公众号

关注公众号,获取一手资讯

“ Python 正则表达式 ” comments 0

评论/回复

电子邮件地址不会被公开。 必填项已用*标注