正则表达式入门

基本语法

界定符
原子
量词
边界控制
模式单元

界定符

表示一个正则表达式的开始和结束

$pattern = '/[0-9]/';
$pattern = '#[0-9]#';
$pattern = '{[0-9]}'; // 不推荐

原子

可见原子

Unicode 编码表中用键盘输出后肉眼可见的字符

标点 ; ” _ ? . 等等
英文字母数字 a-z, A-Z, 0-9
汉字、日文、阿拉伯文等其他语言文字
∑, ∈, ∮, ≌ 等数理化公式符号
其他可见字符

不可见原子

Unicode 编码表中用键盘输出后肉眼不可见的字符

换行符 \n
回车 \r
制表符 \t
空格
其他不可见符号

元字符

原子的筛选方式

| 匹配两个或者多个分支选择
[] 匹配方括号中的任意一个原子
[^] 匹配除方括号中的原子之外的任意字符

原子的集合

. 匹配除换行符之外的任意字符
\d 匹配任意一个十进制数字，即 [0-9]
\D 匹配任意一个非十进制数字，即 [^0-9]
\s 匹配一个不可见原子，即 [\f\r\n\t\v]
\S 匹配一个可见原子，即 [^\f\r\n\t\v]
\w 匹配任意一个数字、字母或下划线，即 [0-9a-zA-Z_]
\W 匹配任意一个非数字、字母或下划线，即 [^0-9a-zA-Z_]

量词

{n} 表示其前面的原子恰好出现 n 次
{n,} 表示其前面的原子最少出现 n 次
{n,m} 表示其前面的原子最少出现 n 次，最多出现 m 次
* 匹配 0 次、1 次或者多次其之前的原子，即 {0,}
+ 匹配 1 次或者多次其之前的原子，即 {1,}
? 匹配 0 次或者 1 次其之前的原子，即 {0,1}

边界控制

^ 匹配字符串开始的位置
$ 匹配字符串结尾的位置

模式单元

() 匹配其中的整体为一个原子

修正模式

贪婪匹配：匹配结果存在歧义时取其长（人家还想要嘛）
懒惰匹配：匹配结果存在歧义时取其短（不要跟我比懒，因为我懒得跟你比）

U/u 懒惰匹配/贪婪匹配
i 忽略英文字母大小写
x 忽略空白
s 让元字符 . 匹配包括换行符在内所有字符
e 配合函数 preg_replace() 使用，可以把匹配来的字符串当作正则表达式执行

常见正则表达式

非空：/.+/
保留两位小数：/\d+\.\d{2}$/
手机号：/^1[3-9]\d{9}$/
Email 地址：/^\w+(\.\w+)*@\w+(\.\w+)+$/
URL 地址：/^(https?:\/\/)?(\w+\.)+[a-zA-Z]+$/
IP 地址：/^(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?).){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)$/
中国大陆邮政编码：[1-9]\d{5}(?!\d)
身份证：\d{15}|\d{18}
十六进制值：/^#?([a-f0-9]{6}|[a-f0-9]{3})$/
Unicode 编码中的汉字范围：/^[u4e00-u9fa5],{0,}$/
中文字符：[\u4e00-\u9fa5]
双字节字符（包括汉字）：[^\x00-\xff]
空白行：\n\s*\r
首尾空白字符：/^\s|\s$/

把一串数字表示成千位分隔形式，例如10000000000，转换成10,000,000,000：/(?!^)(?=(\d{3})+\.)/g

基本语法

界定符

原子

可见原子

不可见原子

元字符

量词

边界控制

模式单元

修正模式

常见正则表达式

在网页字体加载期间所有文本都保持可见状态

WordPress使用webP格式减少图片体积

微信小程序中组件无法使用全局样式 (app.wxss)

datetimepicker控件在formvalidation框架中的问题

正则表达式入门

基本语法

界定符

原子

可见原子

不可见原子

元字符

量词

边界控制

模式单元

修正模式

常见正则表达式

在网页字体加载期间 所有文本都保持可见状态

WordPress使用webP格式减少图片体积

微信小程序中组件无法使用全局样式 (app.wxss)

datetimepicker控件在formvalidation框架中的问题

在网页字体加载期间所有文本都保持可见状态