正则表达式含义:
1、正则表达式,又称规则表达式,(Regular Expression,在代码中常简写为regex、regexp或RE),是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为"元字符"),是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串,通常被用来检索、替换那些符合某个模式(规则)的文本。
2、许多程序设计语言都支持利用正则表达式进行字符串操作。例如,在Perl中就内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开来的,后来在广泛运用于Scala、PHP、C#、Java、C++、Objective-c、Perl、Swift、VBScript、Javascript、Ruby以及Python等等。正则表达式通常缩写成“regex”,单数有regexp、regex,复数有regexps、regexes、regexen。
正则表达式常用语法:
(1)通配符
?:匹配文件中的0个或1个字符
*:匹配0个或多个字符
^:匹配字符串的开始位置,如^a指匹配以a字母为开始的所有字符串
$:匹配字符串的结尾位置,以什么为结尾
+:匹配一次或多次
[]:中括号表达式
(2)普通字符
[A-Z]匹配所有大写字母
[a-z]匹配所有小写字母
\w匹配字母、数字、下划线,相当于[A-Za-z0-9]
(3)非打印字符
\n匹配换行符
\r匹配回车符
\t匹配制表符
(4)限定字符
*、+、?
{n}匹配n次,n指非负整数
{n,}至少匹配n次
{n,m}最少匹配n次,最多匹配m次
(5)修饰符
i:不区分大小写
g:全局匹配
m:多行匹配