正则表达式匹配html 过滤非法字符

更新时间：2016年11月25日 16:50 点击：2216

匹配一个html标签，匹配table如下：

<table.*?>[ss]*</table>
或
<table.*?>[ss]*?</table>

以上两个表达式，一个加了"?"和一个却不加"?"，那么这有什么区别呢？
我们知道"?"在正则表达式里是一个通配符：匹配前面的子表达式零次或一次，或指明一个非贪婪限定符。

在这里，通过测试，我们得出这样的结论：在不加"?"的情况下，在匹配下面一段内容的时候：

<table>这是第一个table</table>
我不是table里的内容
<table>这是第二个table</table>
我也不是table里的内容
<table>这是第三个table</table>

$str=preg_replace("/s+/", " ", $str); //过滤多余回车
$str=preg_replace("/<[ ]+/si","<",$str); //过滤<__("<"号后面带空格)

$str=preg_replace("//si","",$str); //注释
$str=preg_replace("/<(!.*?)>/si","",$str); //过滤doctype
$str=preg_replace("/<(/?html.*?)>/si","",$str); //过滤html标签
$str=preg_replace("/<(/?head.*?)>/si","",$str); //过滤head标签
$str=preg_replace("/<(/?meta.*?)>/si","",$str); //过滤meta标签
$str=preg_replace("/<(/?body.*?)>/si","",$str); //过滤body标签
$str=preg_replace("/<(/?link.*?)>/si","",$str); //过滤link标签
$str=preg_replace("/<(/?form.*?)>/si","",$str); //过滤form标签
$str=preg_replace("/cookie/si","cookie",$str); //过滤cookie标签

$str=preg_replace("/<(applet.*?)>(.*?)<(/applet.*?)>/si","",$str); //过滤applet标签
$str=preg_replace("/<(/?applet.*?)>/si","",$str); //过滤applet标签

$str=preg_replace("/<(style.*?)>(.*?)<(/style.*?)>/si","",$str); //过滤style标签
$str=preg_replace("/<(/?style.*?)>/si","",$str); //过滤style标签

$str=preg_replace("/<(title.*?)>(.*?)<(/title.*?)>/si","",$str); //过滤title标签
$str=preg_replace("/<(/?title.*?)>/si","",$str); //过滤title标签

$str=preg_replace("/<(object.*?)>(.*?)<(/object.*?)>/si","",$str); //过滤object标签
$str=preg_replace("/<(/?objec.*?)>/si","",$str); //过滤object标签

$str=preg_replace("/<(noframes.*?)>(.*?)<(/noframes.*?)>/si","",$str); //过滤noframes标签
$str=preg_replace("/<(/?noframes.*?)>/si","",$str); //过滤noframes标签

$str=preg_replace("/<(i?frame.*?)>(.*?)<(/i?frame.*?)>/si","",$str); //过滤frame标签
$str=preg_replace("/<(/?i?frame.*?)>/si","",$str); //过滤frame标签

$str=preg_replace("/<(script.*?)>(.*?)<(/script.*?)>/si","",$str); //过滤script标签
$str=preg_replace("/<(/?script.*?)>/si","",$str); //过滤script标签
$str=preg_replace("/网页特效/si","javascript",$str); //过滤script标签
$str=preg_replace("/vbscript/si","vbscript",$str); //过滤script标签
$str=preg_replace("/on([a-z]+)s*=/si","on\1=",$str); //过滤script标签
$str=preg_replace("/&#/si","&＃",$str); //过滤script标签，如javascript:alert('aabb)

del_dir(删除的路径,1表示删除目录下数据，0默认删除本目录);

代码如下

复制代码

非负浮点数（正浮点数 + 0）：^d+(.d+)?$
正浮点数 ^(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*))$
非正浮点数（负浮点数 + 0） ^((-d+(.d+)?)|(0+(.0+)?))$
负浮点数 ^(-(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*)))$
浮点数 ^(-?d+)(.d+)?

^[1-9]d*$　　

//匹配正整数

^-[1-9]d*$ 　

//匹配负整数

^-?[1-9]d*$

//匹配整数

^[1-9]d*|0$　

//匹配非负整数（正整数 + 0）

^-[1-9]d*|0$

//匹配非正整数（负整数 + 0）

^[1-9]d*.d*|0.d*[1-9]d*$　

　 //匹配正浮点数

^-([1-9]d*.d*|0.d*[1-9]d*)$　

//匹配负浮点数

^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$　

//匹配浮点数

^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$　

　 //匹配非负浮点数（正浮点数 + 0）

^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$　

　//匹配非正浮点数（负浮点数 + 0）

验证数字：^[0-9]*$
验证n位的数字：^d{n}$
验证至少n位数字：^d{n,}$
验证m-n位的数字：^d{m,n}$
验证零和非零开头的数字：^(0|[1-9][0-9]*)$
验证有两位小数的正实数：^[0-9]+(.[0-9]{2})?$
验证有1-3位小数的正实数：^[0-9]+(.[0-9]{1,3})?$
验证非零的正整数：^+?[1-9][0-9]*$
验证非零的负整数：^-[1-9][0-9]*$
验证非负整数（正整数 + 0） ^d+$
验证非正整数（负整数 + 0） ^((-d+)|(0+))$
验证长度为3的字符：^.{3}$

?>
<input onkeyup="value=value.replace(/[^(d|.)]/g,'') "onbeforepaste="clipboarddata.setdata('text',clipboarddata.getdata('text').replace(/[^(d|.)]/g,''))" >

php教程字符串截取函数
在php中有一款字符串截取函数substr但这款函数，只能截取英文不支持中文与其

它的混体，下面我们提供了三款函数，它们可以支持中英文混合体。

function syssubstr($string,$length,$append = false)
{
if (strlen($string) < = $length )
{
return $string;
}
else
{
$i = 0;
while ($i < $length)
{
$stringtmp = substr($string,$i,1);
if ( ord($stringtmp) >=224 )
{
$stringtmp = substr($string,$i,3);
$i = $i + 3;
}
elseif( ord($stringtmp) >=192 )
{
$stringtmp = substr($string,$i,2);
$i = $i + 2;
}
else
{
$i = $i + 1;
}
$stringlast[] = $stringtmp;
}
$stringlast = implode("",$stringlast);
if($append)
{
$stringlast .= "...";
}
return $stringlast;
}
}

$string = "";
$length = "18";
$append = false;
echo syssubstr($string,$length,$append);

字符串截取函数二

function cut_str($string,$sublen,$start=0,$code='utf-8')
{
if($code=='utf-8')
{
$pa="/[x01-x7f]|[xc2-xdf][x80-xbf]|xe0[xa0-xbf][x80-xbf]|[xe1-xef]

[x80-xbf][x80-xbf]|xf0[x90-xbf][x80-xbf][x80-xbf]|[xf1-xf7][x80-xbf]

[x80-xbf][x80-xbf]/";
preg_match_all($pa,$string,$t_string);

if(count($t_string[0])-$start>$sublen) return join('',array_slice

($t_string[0],$start,$sublen))."...";
return join('',array_slice($t_string[0],$start,$sublen));
}
else
{
$start=$start*2;
$sublen=$sublen*2;
$strlen=strlen($string);
$tmps教程tr='';

for($i=0;$i<$strlen;$i++)
{
   if($i>=$start&&$i<($start+$sublen))
   {
    if(ord(substr($string,$i,1))>129)
    {
     $tmpstr.=substr($string,$i,2);
    }
    else
    {
     $tmpstr.=substr($string,$i,1);
    }
   }
   if(ord(substr($string,$i,1))>129) $i++;
}
if(strlen($tmpstr)<$strlen ) $tmpstr.="...";
return $tmpstr;
}
}

$str="新程php培训";
echo cut_str($str,8,0,'gb2312');

函数三

<?php
//截取utf8字符串
function utf8substr($str, $from, $len)
{
return preg_replace('#^(?:[x00-x7f]|[xc0-xff][x80-xbf]+)

{0,'.$from.'}'.
'((?:[x00-x7f]|[xc0-xff][x80-xbf]+){0,'.$len.'}).*#s',
'$1',$str);
}
?>

上面三款函数都很好对中文字符等进行截取了，好了不说多了这些都是来自于网络

。

代码如下

复制代码

<!doctype html public "-//w3c//dtd xhtml 1.0 transitional//en" "http://www.w3.org/tr/xhtml1/dtd/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="content-type" content="text/html; charset=utf-8" />
<title>environment</title>
</head>
<?php
$str = "中12hb千钧一发lap";
echo mb_substr($str,0,5,'utf-8');echo '<br>';
echo mb_substr($str,5,3,'utf-8');echo '<br>';
echo mb_substr($str,8,4,'utf-8');
?>
<body>
</body>
</html>

代码如下

复制代码

echo str_wrap1($str,5);

[!--infotagslink--]

下一篇: php str_replace函数（可限制替换个数)

PHP正则表达式取双引号内的内容
取双引号内的内容我们如果一个字符串中只有一个可以使用explode来获得，但如果有多个需要使用正则表达式来提取了，具体的例子如下。写程序的时候总结一点经验，如何只...2016-11-25
PHP正则表达式之捕获组与非捕获组
今天遇到一个正则匹配的问题，忽然翻到有捕获组的概念，手册上也是一略而过，百度时无意翻到C#和Java中有对正则捕获组的特殊用法，搜索关键词有PHP时竟然没有相关内容，自己试了一下，发现在PHP中也是可行的，于是总结一下，分享的同...2015-11-08
一个关于JS正则匹配的踩坑记录
这篇文章主要给大家介绍了一个关于JS正则匹配的踩坑记录，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧...2021-04-13
php 验证只能输入汉字、英语、数字的正则表达式
正则表达式是一门非常有用的并且进行模糊判断的一个功能了，我们下面来看通过正则来验证输入汉字、英语、数字，具体如下。收藏了正则表达式。可以验证只能输入数...2016-11-25
java正则表达式判断前端参数修改表中另一个字段的值
这篇文章主要介绍了java正则表达式判断前端参数修改表中另一个字段的值,需要的朋友可以参考下...2021-05-07
常用的日期时间正则表达式
常用的日期时间正则表达式下面收藏了大量的日期时间正则匹配函数，包括分钟，时间与秒都能达到。正则表达式 (?n:^(?=d)((?<day>31(?!(.0?[2469]|11))|30(?!.0?2)|29(...2016-11-25
PHP正则表达式匹配验证提取网址URL实例总结
网址规则是可寻的，所以我们可以使用正则表达式来提取字符串中的url地址了，下面一起来看看小编整理的几个PHP正则表达式匹配验证提取网址URL实例. 匹配网址 URL 的...2016-11-25
正则表达式中两个反斜杠的匹配规则详解
这篇文章主要介绍了正则表达式中两个反斜杠的匹配规则,本文给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下...2021-05-07
JS中使用正则表达式g模式和非g模式的区别
这篇文章给大家详细介绍了JS中使用正则表达式g模式和非g模式的区别，非常不错，具有参考借鉴价值，需要的朋友参考下吧...2017-04-03
C#正则表达式使用方法示例
这篇文章主要介绍了C#正则表达式使用方法,大家参考使用...2020-06-25
常用C#正则表达式汇总介绍
c#正则表达式,用于字符串处理、表单验证等场合，实用高效。现将一些常用的表达式收集于此，以备不时之需。...2020-06-25
JavaScript利用正则表达式替换字符串中的内容
本文主要介绍了JavaScript利用正则表达式替换字符串中内容的具体实现方法，并做了简要注释，便于理解。具有一定的参考价值，需要的朋友可以看下...2017-01-09
一文秒懂python正则表达式常用函数
这篇文章主要介绍了python正则表达式常用函数及使用方法，本文给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下...2021-05-07
Idea使用正则表达式批量替换字符串的方法
这篇文章给大家介绍了Idea使用正则表达式批量替换字符串的方法，本文给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友参考下吧...2021-07-21
PHP正则表达式之捕获组与非捕获组
今天遇到一个正则匹配的问题，忽然翻到有捕获组的概念，手册上也是一略而过，百度时无意翻到C#和Java中有对正则捕获组的特殊用法，搜索关键词有PHP时竟然没有相关内容，自己试了一下，发现在PHP中也是可行的，于是总结一下，分享的同...2015-11-08
js正则学习小记之匹配字符串字面量
关于匹配字符串问题，有很多种类型，今天讨论 js 代码里的字符串匹配，因为我想学完之后写个语法高亮练手，所以用js代码当作例子...2021-05-07
C# 中使用正则表达式匹配字符的含义
正则表达式的作用用来描述字符串的特征。本文重点给大家介绍C# 中使用正则表达式匹配字符的含义，非常不错，具有一定的参考借鉴价值，需要的朋友参考下吧...2020-06-25
Python验证的50个常见正则表达式
这篇文章主要给大家介绍了关于利用Python验证的50个常见正则表达式的相关资料，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧...2021-03-11
C#编程自学之运算符和表达式
这篇文章主要介绍了C#运算符和表达式,这是自学C#编程的第五篇，希望对大家的学习有所帮助。...2020-06-25
PHP正则表达式过滤html标签属性(DEMO)
这篇文章主要介绍了PHP正则表达式过滤html标签属性的相关内容，实用性非常，感兴趣的朋友参考下吧...2016-05-06

正则表达式匹配html 过滤非法字符

相关文章

阁下可能感兴趣的内容

推荐阅读