PHP常用正则表达式函数学习笔记
正则语法规则
我们先介绍三个东西,然后可以进行简单的例子了。
一、定界符 "/" 左斜线
php采用左斜线作为定界符,规定规则的边界,成对出现,两个定界符之间的内容就是需要被匹配的规则
二、元字符---出现模式类
匹配方式,可以用来规定其前导字符(即位于元字符前面的字符)在目标对象中的出现模式。
比如出现一次,出现多于一次,出现多次,没有出现。等等。
常用的有:
+ 1次或多次
* 0次或1次或多次
? 0次或1次
{2,6} 2-6次
{2} 恰巧2次
{3,} 至少3次,>=3
三、元字符---特定字符类
代表一个特定的字符
\s 空白字符(单个空格符、tab键和换行符)
\S 非空白字符
\d 数字(单个 0到9)
\w 字母,数字或下划线字符
\W 非(字母,数字或下划线字符)
. 除换行符之外的所有字符
1. preg_match()函数
函数原型:int preg_match (string $pattern, string $content [, array $matches])
preg_match ()函数在$content字符串中搜索与$pattern给出的正则表达式相匹配的内容。如果提供了$matches,则将匹配结果放入其 中。$matches[0]将包含与整个模式匹配的文本,$matches[1]将包含第一个捕获的与括号中的模式单元所匹配的内容,以此类推。该函数只 作一次匹配,最终返回0或1的匹配结果数。代码6.1给出
preg_match()函数在字符串中搜索模式,如果存在则返回true,否则返回false
代码如下 | 复制代码 |
$pattern='/php/'; |
输出结果:1
2. preg_grep()函数
preg_grep()函数搜索数组中的所有元素,返回由与某个模式匹配的所有元素组成的数组
代码如下 | 复制代码 |
$pattern='/p$/'; |
输出结果:
Array
(
[0] => asp
[1] => php
[2] => jsp
)
3. preg_match_all()函数
preg_match_all()函数在字符串中匹配模式的所有出现,然后将所有匹配到的全部放入数组
代码如下 | 复制代码 |
<?php |
4. preg_quote()函数
preg_quote()函数在每个对于正则表达式语法而言有特殊含义的字符前插入一个反斜线。
echo preg_quote('苹果的价格是:$5/千克');
输出结果:苹果的价格是:\$5/千克
5. preg_replace()函数
preg_replace()函数搜索到所有的匹配,然后替换成想要的字符串返回
代码如下 | 复制代码 |
$pattern='/php[1-5]/'; echo preg_replace($pattern,'PHP',$str); |
输出结果:PHPPHPPHPPHPPHPphp6php7php8
6. preg_split()函数
preg_split()函数以不区分大小写的方式分割字符串,将所得到的字串组成数组并返回
代码如下 | 复制代码 |
$pattern='/[\.@]/'; print_r(preg_split($pattern,$str)); 输出结果:
|
ereg()和eregi()
ereg()是POSIX扩展库中正则表达式的匹配函数。eregi()是ereg()函数的忽略大小写的版 本。二者与preg_match的功能类似,但函数返回的是一个布尔值,表明匹配成功与否。需要说明的是,POSIX扩展库函数的第一个参数接受的是正则 表达式字符串,即不需要使用分界符。例如,代码6.2是一个关于文件名安全检验的方法。
代码6.2 文件名的安全检验
代码如下 | 复制代码 |
<?php |
通常情况下,使用与Perl兼容的正则表达式匹配函数perg_match(),将比使用ereg()或eregi()的速度更快。如果只是查找一个字符串中是否包含某个子字符串,建议使用strstr()或strpos()函数
preg_replace()
函数原型:mixed preg_replace (mixed $pattern, mixed $replacement, mixed $subject [, int $limit])
preg_replace较ereg_replace的功能更加强大。其前三个参数均可以使用数组;第四个参数$limit可以设置替换的次数,默认为全部替换。代码6.7是一个数组替换的应用实例
代码如下 | 复制代码 |
<?php |
例子代码如下,可常用于采集哦、
代码如下 | 复制代码 |
//提取标题 /** function getDescription($html){ /**
|
从上面例子来看其实都是非常的简单就是批有规律的标签为开始与结束节点,这样我们可以获取这两个字符之类的内容也就是我们要提取的内容了哦,只是在中间有字符或空格的一些处理了哦。
今天在一个群里看到一个站长在问如何把一段字符串中指定两个字符串这间的内容提取出来,这个我是想用于做文章分页标签了,但后来测试多个标题此方法暂时不行,单个撮是没有问题的。例子,
代码如下 | 复制代码 |
<?php $fcontents ="fdsafdafdsa{page}中国要呀{/page}dafdsafdsafdsafdsa"; if(eregi("{page}(.*){/page}", $fcontents,$regs)){ //echo "成功"; //print_r($regs); echo $regs[1]; } else{ echo "失败"; } exit; ?> |
输出结果
中国要呀
那么我们如果测试放多个标签会怎么样呢
代码如下 | 复制代码 |
<?php $fcontents ="fdsafdafdsa{page}中国要呀{/page}dafdsafdsafdsafdsa{page}你好中国{/page}fdsafdsafsda{page}我爱中国{/page}fdafdsa";
|
输出结果
中国要呀{/page}dafdsafdsafdsafdsa{page}你好中国{/page}fdsafdsafsda{page}我爱中国
发现这个闭合会有问题了,暂时还没想到办法。
以前有分享过一个专用的过滤html标签的php函数了,但给很多人转载了最近搜索了一下发现有些问题,现在我只要过滤js代码了,下面来看一个正则过滤吧。js代码正则
代码如下 | 复制代码 |
<script[^>]*?>.*?</script>'si", // 去掉 javascript |
起初使用,m代表多行匹配,测试多次单行可以替换,多行没效果。
代码如下 | 复制代码 |
preg_replace('/<script.*?<\/script>/m', '', $html); |
原来.不匹配换行,添加s修饰符正常:
代码如下 | 复制代码 |
preg_replace('/<script.*?<\/script>/ms', '', $html); |
例子 利用tidy_parse_file工具
代码如下 | 复制代码 |
<?php |
该类库是jehna/VerbalExpressions的php版本。
这货的竟然通过链式方法把正则给语义化了。。。我表示很愤慨啊。。。
安装
代码如下 | 复制代码 |
加入composer.json { |
使用
代码如下 | 复制代码 |
<?php require_once 'vendor/autoload.php'; use MarkWilson\VerbalExpression; use MarkWilson\VerbalExpression\Matcher; // 初始化VerbalExpression实例 $verbalExpression = new VerbalExpression(); // URL地址匹配 $verbalExpression->startOfLine() ->then('http') ->maybe('s') ->then('://') ->maybe('www.') ->anythingBut(' ') ->endOfLine(); // 编译表达式 - 返回: ^(http)(s)?(\:\/\/)(www\.)?([^\ ]*)$ $verbalExpression->compile(); // 执行匹配 preg_match($verbalExpression, 'http://www.111cn.net'); // 返回 1 // 或 $matcher = new Matcher(); $matcher->isMatch($verbalExpression, 'http://www.google.com'); // 返回 true |
嵌套表达式
代码如下 | 复制代码 |
<?php $innerExpression = new VerbalExpression(); $innerExpression->word(); $outerExpression = new VerbalExpression(); $outerExpression->startOfLine() ->find($innerExpression) ->then($innerExpression) ->endOfLine(); // 返回 ^(\w+)(\w+)$ $outerExpression->compile(); |
禁用子模式捕获
默认情况下,子匹配规则可以被获取,并返回匹配的数组。
代码如下 | 复制代码 |
<?php // 禁用获取子匹配规则 $verbalExpression->disableSubPatternCapture()->word(); // (?:\w+) // 或 $verbalExpression->word(false); // (?:\w+) |
这样做只会影响后续增加的表达式;任何已经添加的匹配规则不会受到影响。这里允许禁用和启用组。
代码如下 | 复制代码 |
<?php |
相关文章
- 取双引号内的内容我们如果一个字符串中只有一个可以使用explode来获得,但如果有多个需要使用正则表达式来提取了,具体的例子如下。 写程序的时候总结一点经验,如何只...2016-11-25
- 今天遇到一个正则匹配的问题,忽然翻到有捕获组的概念,手册上也是一略而过,百度时无意翻到C#和Java中有对正则捕获组的特殊用法,搜索关键词有PHP时竟然没有相关内容,自己试了一下,发现在PHP中也是可行的,于是总结一下,分享的同...2015-11-08
- 正则表达式是一门非常有用的并且进行模糊判断的一个功能了,我们下面来看通过正则来验证输入汉字、英语、数字,具体如下。 收藏了正则表达式。可以验证只能输入数...2016-11-25
- 这篇文章主要介绍了java正则表达式判断前端参数修改表中另一个字段的值,需要的朋友可以参考下...2021-05-07
- 常用的日期时间正则表达式 下面收藏了大量的日期时间正则匹配函数,包括分钟,时间与秒都能达到。 正则表达式 (?n:^(?=d)((?<day>31(?!(.0?[2469]|11))|30(?!.0?2)|29(...2016-11-25
- 网址规则是可寻的,所以我们可以使用正则表达式来提取字符串中的url地址了,下面一起来看看小编整理的几个PHP正则表达式匹配验证提取网址URL实例. 匹配网址 URL 的...2016-11-25
- 我们在php中上传文件就必须使用#_FILE变量了,这个自动全局变量 $_FILES 从 PHP 4.1.0 版本开始被支持。在这之前,从 4.0.0 版本开始,PHP 支持 $HTTP_POST_FILES 数组。这...2016-11-25
- 1、简介Smarty是一个使用PHP写出来的模板PHP模板引擎,是目前业界最著名的PHP模板引擎之一。它分离了逻辑代码和外在的内容,提供了一种易于管理和使用的方法,用来将原本与HTML代码混杂在一起PHP代码逻辑分离。简单的讲,目...2014-05-31
- 这篇文章主要介绍了正则表达式中两个反斜杠的匹配规则,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下...2021-05-07
- 这篇文章给大家详细介绍了JS中使用正则表达式g模式和非g模式的区别,非常不错,具有参考借鉴价值,需要的朋友参考下吧...2017-04-03
- 这篇文章主要介绍了C#正则表达式使用方法,大家参考使用...2020-06-25
- c#正则表达式,用于字符串处理、表单验证等场合,实用高效。现将一些常用的表达式收集于此,以备不时之需。...2020-06-25
- 本文主要介绍了JavaScript利用正则表达式替换字符串中内容的具体实现方法,并做了简要注释,便于理解。具有一定的参考价值,需要的朋友可以看下...2017-01-09
- 这篇文章主要介绍了python正则表达式常用函数及使用方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下...2021-05-07
- 当我们在星际中开地图和几家电脑作战的时候,电脑的几个玩家相当于结盟,一旦我们出兵进攻某一家电脑,其余的电脑会出兵救援。 那么如何让各家电脑知道自己的盟友被攻击了...2016-11-25
- 这篇文章给大家介绍了Idea使用正则表达式批量替换字符串的方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧...2021-07-21
- 今天遇到一个正则匹配的问题,忽然翻到有捕获组的概念,手册上也是一略而过,百度时无意翻到C#和Java中有对正则捕获组的特殊用法,搜索关键词有PHP时竟然没有相关内容,自己试了一下,发现在PHP中也是可行的,于是总结一下,分享的同...2015-11-08
- 正则表达式的作用用来描述字符串的特征。本文重点给大家介绍C# 中使用正则表达式匹配字符的含义,非常不错,具有一定的参考借鉴价值,需要的朋友参考下吧...2020-06-25
- 这篇文章主要给大家介绍了关于利用Python验证的50个常见正则表达式的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧...2021-03-11
- 这篇文章主要介绍了C#运算符和表达式,这是自学C#编程的第五篇,希望对大家的学习有所帮助。...2020-06-25