php抓取百度快照、百度收录、百度热词程序代码

 更新时间:2016年11月25日 17:31  点击:2001
如果大家稍加仔细看一下就能发现一个问题,我们下面几个抓取百度收录或快照或热词的程序中都有一个函数file_get_contents(),他是php采集网页常用的哦。
 代码如下 复制代码


<?
/*
抓取百度收录代码
*/
function baidu($s){
  $baidu="http://www.baidu.com/s?wd=site%3A".$s;
  $site=file_get_contents($baidu);
  //$site=iconv("gb2312", "UTF-8", $site);
  ereg("找到相关网页(.*)篇,", $site,$count);
  $count=str_replace("找到相关网页","",$count);
  $count=str_replace("篇,","",$count);
  $count=str_replace("约","",$count);
  $count=str_replace(",","",$count);
  return $count[0];
}

echo baidu(www.111cn.net); //获取好主题在百度中的收录数量

?>

获取百度的热词

 代码如下 复制代码

<?php
/**
* * @user 小杰
* @return array 返回百度的热词数据(数组返回)
*/
function getBaiduHotKeyWord()
{
$templateRss = file_get_contents('http://top.baidu.com/rss_xml.php?p=top10');
If (preg_match('/<table>(.*)</table>/is', $templateRss, $_description)) {
$templateRss = $_description [0];
$templateRss = str_replace("&", "&", $templateRss);
}
$templateRss = "<?xml version="1.0" encoding="GBK"?>" . $templateRss;
$xml = simplexml_load_String($templateRss);
foreach ($xml->tbody->tr as $temp) {
if (!empty ($temp->td->a)) {
$keyArray [] = trim(($temp->td->a));
}
}
return $keyArray;
}
print_r(getBaiduHotKeyWord());


这是在网上找的 稍微修改了下 将下面代码写入php文件
百度收录和百度快照时间

 代码如下 复制代码

<?php
    $domain = “http://www.111cn.net/nokia/5230/ *欲查询的域名*/
    $site_url = ‘http://www.baidu.com/s?wd=site%3A’;
    $all = $site_url.$domain; /*域名所有收录的网址*/
    $today = $all.’&lm=1′;    /*域名今日收录的网址*/
    $utf_pattern = “/找到相关结果数(.*)个/”;
    $kz_pattern = “/<span class=”g”>(.*)</span>/”; /*用以匹配快照日期的字符串*/
    $times = “/d{4}-d{1,2}-d{1,2}/”; /*匹配快照日期的正则表达式,如:2011-8-4*/
    $s0 = @file_get_contents($all);    /*将site:www.ninthday.net的网页置入$s0字符串中*/
    $s1 = @file_get_contents($today);
    preg_match($utf_pattern,$s0,$all_num); /*匹配”找到相关结果数*个”*/
    preg_match($utf_pattern,$s1,$today_num);
    preg_match($kz_pattern,$s0,$temp);
    preg_match($times,$temp[0],$screenshot);
    if($all_num[1] == “”)
        $all_num[1] = 0;
    if($today_num[1] == “”)
        $today_num[1] = 0;
    if($screenshot[0] == “”)
        $screenshot[0] = “暂无快照”;
?>
<html>
    <head>
    <title>Test</title>
    </head>
<body>
  <table>
    <tr>
      <td>日期</td><td>百度收录</td><td>百度今日收录</td><td>百度快照日期</td>
    </tr>
    <tr>
      <td><?php echo date(‘m月d日G时’);?> </td><td><?php echo $all_num[1]; ?></td><td><?php echo $today_num[1]; ?></td><td><?php echo $screenshot[0]; ?></td>
    </tr>

  </table>
    <p>百度收录:<a href=”<?php echo $all; ?>” target=”_blank”><?php echo $all_num[1]; ?></a></p>
    <p>百度今日收录:<a href=”<?php echo $today; ?>” target=”_blank”><?php echo $today_num[1]; ?></a></p>
    <p>百度快照日期:<a href=”<?php echo $all; ?>”><?php echo $screenshot[0]; ?></a></p>
</body>
</html>

上面的方法未经过严格考虑,如果服务器不支持file_get_contents函数我们就无法操作了,所以还可以利用curl操作,这个更方便可以模仿用户哦。

这是一段很简单的程序利用了php的file_get_contents函数来采集百度的数据,然后通过simplexml_load_String把它数据解析出来,这样数据就保存到了一个数组,我们就可以方便的利用了。
 代码如下 复制代码

function getBaiduHotKeyWord()
{
    $templateRss = file_get_contents('http://top.baidu.com/rss_xml.php?p=top10');
    If (preg_match('/<table>(.*)</table>/is', $templateRss, $_description)) {
        $templateRss = $_description [0];
        $templateRss = str_replace("&", "&amp;", $templateRss);
    }
    $templateRss = "<?xml version="1.0" encoding="GBK"?>" . $templateRss;
    $xml = simplexml_load_String($templateRss);
    foreach ($xml->tbody->tr as $temp) {
        if (!empty ($temp->td->a)) {
            $keyArray [] = trim(($temp->td->a));
        }
    }
    return $keyArray;
}

聊天室很多程序可以实现,原理也简单只要一个无刷新就可以实现,最简单的就是利用一个iframe不停的刷新页面把用户的记录从数据库读出来就可以了。

MySQL并发能力强、响应速度快,是性能优异的数据库软件;PHP是功能强大的服务器端脚本语言。笔者在山西铝厂网站开发中,采用PHP4.0+MySQL3.23.38建立了多种应用。下面,以一个简单的聊天室设计为例,介绍PHP+MySQL在网页开发中的应用。

  1、总体设计

  1.1 构思与规划:

  聊天室的基本原理,就是把每个连上同一网页的用户传送的发言数据储存起来,然后将所有的发言数据传给每一用户。也就是说,用数据库汇集每个人的发言,并将数据库中的数据传给每一个人就实现了聊天室的功能。

  1.2 表设计

  首先使用MySQL建立表chat用来储存用户的发言:

 

 代码如下 复制代码

mysql> CREATE TABLE chat
-> (chtime DATATIME,
-> nick CHAR(10) NOT NULL,
->words CHAR(150));


  表中只设定了三个域,chtime是发言的时间,nick为发言者的昵称,words是发言的内容,发言最多150个字符

  1.3 网页设计

  一个最简单的聊天室通常需要两个页框:一个页框是用户输入发言的表单,另一个用来显示大家的发言。所以代码段通常至少需要如下几段:

  建立页框的结构(main.php)

  显示大家发言的程序段(cdisplay.php)

  传送用户发言的程序段(speak.php)

  用户登录进入聊天室程序段(login.php)

  2、代码设计

  以上规划完成后,就可以着手代码设计了,采用php可以非常简明实现以上的功能。

  2.1 用户登录login.php,本段代码是一个完全HTML网页

 

 代码如下 复制代码
<html>
<head>
 <title>用户登录</title>
</head>
<body>请输入您的昵称<br>
<form action=”main.php” method=”post” target=”_self”>
 <input type=”text” name=”nick” cols=”20”>
 <input type=”submit” value=”登录”>
</body>
</html>


  用户提交自己的昵称后,就进入到聊天室,以下的处理交由main.php处理。

 

  2.2 页框主体代码段main.php:

 代码如下 复制代码

<?
 setcookie(“nick”,$nick) //用cookie记录用户昵称,是常用的传递变量方法
?>

<html>
<title>山西铝厂聊天室试用版ver1.0</title>
<frameset rows=”80%,*”>
<frame src=” cdisplay.php” name=”chatdisplay”>
<frame src=”speak.php” name=”speak”>
</frameset>
</html>


  2.3 显示发言cdisplay.php

  本代码段的任务是将表chat中的数据取出,显示在页框中。每次刷新时,取数据库中最近的15条发言。同时,为防止数据库无限增大,需设计删除陈旧数据的功能。代码如下

 

 代码如下 复制代码
<html>
<head>
 <title>显示用户发言</title>
 <meta http-equiv=”refresh” content=”5;url=cdisplay.php”>
</head>
<body>
<?
 $link_ID=mysql_connect(“main”,”root”);
 //链接Mysql服务器 服务器名为main,管理员名为root
 mysql_select_db(“abc”); //选择数据库
 $str=”select * from chat ORDER BY chtime;” ; //查询字符串
 $result=mysql_query($str, $link_ID); //送出查询
 $rows=mysql_num_rows($result); //取得查询结果的记录笔数
 //取得最后15笔发言,并显示
 @mysql_data_seek($resut,$rows-15); //移动记录指针到前15笔记录
 if ($rows<15) $l=$rows; else $l=15; //记录总数小于15,则最多为该记录数
 for ($i=1;$i<=$l;$i++) {
  list($chtime,$nick,$words)=mysql_fetch_row($result);
  echo $chtime; echo “ “;echo $nick; echo”:” ; echo $words; echo “<BR>”;
 }
 //清除库中过时的数据
 @mysql_data_seek($result,$rows-20); //移动记录指针到前20笔记录
 list($limtime)=mysql_fetch_row($result);
 $str=”DELETE FROM chat WHERE chtime<’$limtime’ ;” ;
 $result=mysql_query($str,$link_ID); //送出查询字符串,库中只留前20个记录
 mysql_close($link_ID);
?>
</body>
</html>

 2.4 送出发言到数据库speak.php

 

 代码如下 复制代码
<html>
<head>
 <title>发言</title>
</head>
<body>
<?
 If ($words)
  { $link_ID=mysql_connect(“main”,”root”);
  mysql_select_db(“abc”); //数据库名为abc
  $time=date(y).date(m).date(d).date(h).date(i).(date(s); //取得当前时间
  $str=”INSERT INTO chat(chtime,nick,words) values
    (‘$time’,’$nick’,’$words’);” ;
  mysql_query($str,$link_ID); //送出发言到数据库
  mysql_close($link_ID);
 }
?>

//输入发言的表单

 代码如下 复制代码

<form action=”speak.php” method=”post” target=” _self”>
 <input type=”text” name=”words” cols=”20”>
 <input type=”submit” value=”发言”>
</form>
</body>
</html>


  完成以上工作后,一个简单的聊天室制作就完成了

本文章是来自网上的一段购物车代码,是基于php+mysql的,有需要的同学可以看看我下面还推荐了多种购物车的方法,有需要的同学可以看看这些购物车代码是不是自己可用的哦。
 代码如下 复制代码
简单容易理解。cookie存购物车ID,db存购物车数据。
//购物车session的产生代码
if(! $session && ! $scid) {
/*
session用来区别每一个购物车,相当于每个车的身份证号;
scid只用来标识一个购物车id号,可以看做是每个车的名字;
当该购物车的id和session值两者都不存在时,就产生一个新购物车
*/
$session = md5(uniqid(rand()));
/*
产生一个唯一的购物车session号
rand()先产生个随机数,uniqid()再在该随机数的基础上产生一个独一无二的字符串,最后对该字符串进行md5
*/
SetCookie(scid, $session, time() + 14400);
/*
设置该购物车cookie
变量名:scid(不知到这里是不是少了一个 $号呢?=》更正:scid要加“”)
变量值: $session
有效时间:当前时间+14400秒(4小时内)
关于setcookie函数的详细用法,大家还是参看php手册吧~
*/
}
class Cart { //开始购物车类
function check_item( $table, $session, $product) {
/*
查验物品(表名,session,物品)
*/
$query = SELECT * FROM $table WHERE session=' $session' AND product=' $product' ;
/*
看一看'表'里该'购物车'中有没有该'产品'
即,该产品有没有已经放入购物车
*/
$result = mysql_query( $query);
if(! $result) {
return 0;
}
/*
查询失败
*/
$numRows = mysql_num_rows( $result);
if( $numRows == 0) {
return 0;
/*
若没有找到,则返回0
*/
} else {
$row = mysql_fetch_object( $result);
return $row->quantity;
/*
若找到,则返回该物品数量
这里有必要解释一下mysql_fetch_object函数(下面还会用到):
【mysql_fetch_object() 和 mysql_fetch_array() 类似,只有一点区别 - 返回一个对象而不是数组。】
上面这句话摘自php手册,说得应该很明白了吧~
简单的说就是,取一条记录中的某个字段,应该用“->”而不是像数组一样用下标
*/
}
}
function add_item( $table, $session, $product, $quantity) {
/*
添加新物品(表名,session,物品,数量)
*/
$qty = $this->check_item( $table, $session, $product);
/*
调用上面那个函数,先检查该类物品有没有已经放入车中
*/
if( $qty == 0) {
$query = INSERT INTO $table (session, product, quantity) VALUES ;
$query .= (' $session', ' $product', ' $quantity') ;
mysql_query( $query);
/*若车中没有,则像车中添加该物品*/
} else {
$quantity += $qty; //若有,则在原有基础上增加数量
$query = UPDATE $table SET quantity=' $quantity' WHERE session=' $session' AND ;
$query .= product=' $product' ;
mysql_query( $query);
/*
并修改数据库
*/
}
}
function delete_item( $table, $session, $product) {
/*
删除物品(表名,session,物品)
*/
$query = DELETE FROM $table WHERE session=' $session' AND product=' $product' ;
mysql_query( $query);
/*
删除该购物车中该类物品
*/
}
function modify_quantity( $table, $session, $product, $quantity) {
/*
修改物品数量(表名,session,物品,数量)
*/
$query = UPDATE $table SET quantity=' $quantity' WHERE session=' $session' ;
$query .= AND product=' $product' ;
mysql_query( $query);
/*
将该物品数量修改为参数中的值
*/
}
function clear_cart( $table, $session) {
/*
清空购物车(没什么好说)
*/
$query = DELETE FROM $table WHERE session=' $session' ;
mysql_query( $query);
}
function cart_total( $table, $session) {
/*
车中物品总价
*/
$query = SELECT * FROM $table WHERE session=' $session' ;
$result = mysql_query( $query);
/*
先把车中所有物品取出
*/
if(mysql_num_rows( $result) > 0) {
while( $row = mysql_fetch_object( $result)) {
/*
如果物品数量>0个,则逐个判断价格并计算
*/
$query = SELECT price FROM inventory WHERE product=' $row->product' ;
$invResult = mysql_query( $query);
/*
从inventory(库存)表中查找该物品的价格
*/
$row_price = mysql_fetch_object( $invResult);
$total += ( $row_price->price * $row->quantity);
/*
总价 += 该物品价格 * 该物品数量
( 大家应该能看明白吧:) )
*/
}
}
return $total; //返回总价钱
}
function display_contents( $table, $session) {
/*
获取关于车中所有物品的详细信息
*/
$count = 0;
/*
物品数量计数
注意,该变量不仅仅为了对物品数量进行统计,更重要的是,它将作为返回值数组中的下标,用来区别每一个物品!
*/
$query = SELECT * FROM $table WHERE session=' $session' ORDER BY id ;
$result = mysql_query( $query);
/*
先取出车中所有物品
*/
while( $row = mysql_fetch_object( $result)) {
/*
分别对每一个物品进行取详细信息
*/
$query = SELECT * FROM inventory WHERE product=' $row->product' ;
$result_inv = mysql_query( $query);
/*
从inventory(库存)表中查找该物品的相关信息
*/
$row_inventory = mysql_fetch_object( $result_inv);
$contents[product][ $count] = $row_inventory->product;
$contents[price][ $count] = $row_inventory->price;
$contents[quantity][ $count] = $row->quantity;
$contents[total][ $count] = ( $row_inventory->price * $row->quantity);
$contents[description][ $count] = $row_inventory->description;
/*
把所有关于该物品的详细信息放入 $contents数组
$contents是一个二维数组
第一组下标是区别每个物品各个不同的信息(如物品名,价钱,数量等等)
第二组下标是区别不同的物品(这就是前面定义的 $count变量的作用)
*/
$count++; //物品数量加一(即下一个物品)
}
$total = $this->cart_total( $table, $session);
$contents[final] = $total;
/*
同时调用上面那个cart_total函数,计算下总价钱
并放入 $contents数组中
*/
return $contents;
/*
将该数组返回
*/
}
function num_items( $table, $session) {
/*
返回物品种类总数(也就是说,两个相同的东西算一种 好像是废话- -!)
*/
$query = SELECT * FROM $table WHERE session=' $session' ;
$result = mysql_query( $query);
$num_rows = mysql_num_rows( $result);
return $num_rows;
/*
取出车中所有物品,获取该操作影响的数据库行数,即物品总数(没什么好说的)
*/
}
function quant_items( $table, $session) {
/*
返回所有物品总数(也就是说,两个相同的东西也算两个物品 - -#)
*/
$quant = 0;// 物品总量
$query = SELECT * FROM $table WHERE session=' $session' ;
$result = mysql_query( $query);
while( $row = mysql_fetch_object( $result)) {
/*
把每种物品逐个取出
*/
$quant += $row->quantity; //该物品数量加到总量里去
}
return $quant; //返回总量
}
}

下面是关于购物车的内容

http://www.111cn.net/phper/22/33260.htm
http://www.111cn.net/phper/php/40196.htm
http://www.111cn.net/phper/php-gj/35504.htm
http://www.111cn.net/phper/php-gj/34552.htm
http://www.111cn.net/phper/22/33260.htm
http://www.111cn.net/phper/php-gj/33948.htm
http://www.111cn.net/phper/php-gj/39684.htm

本文章介绍了利用php来获取baidu的快照与收录代码,下面我们来看看在php利用什么样的函数与编码转换函数的本实例中的应用吧。

先来看看效果代码如下

百度收录及快照

 代码如下 复制代码

<?php
    $domain = "www.111cn.net";  /*欲查询的域名*/
    $site_url = 'http://www.baidu.com/s?wd=site%3A';
    $all = $site_url.$domain; /*域名所有收录的网址*/
    $today = $all.'&lm=1';    /*域名今日收录的网址*/
    $utf_pattern = "/找到相关结果数(.*)个/";
    $gb2312_pattern = iconv("UTF-8","GB2312",$utf_pattern); /*因为百度为GB2312编码*/
    $kz_pattern = "/<span class="g">(.*)</span>/"; /*用以匹配快照日期的字符串*/
    $times = "/d{4}-d{1,2}-d{1,2}/"; /*匹配快照日期的正则表达式,如:2011-8-4*/
    $s0 = @file_get_contents($all);    /*将site:www.111cn.net的网页置入$s0字符串中*/
    $s1 = @file_get_contents($today);
    preg_match($gb2312_pattern,$s0,$all_num); /*匹配"找到相关结果数*个"*/
    preg_match($gb2312_pattern,$s1,$today_num);
    preg_match($kz_pattern,$s0,$temp);
    preg_match($times,$temp[0],$screenshot);
    if($all_num[1] == "")
        $all_num[1] = 0;
    if($today_num[1] == "")
        $today_num[1] = 0;
    if($screenshot[0] == "")
        $screenshot[0] = "暂无快照";
?>
<html>
    <head>
    <title>Test</title>
    </head>
<body>
    <p>百度收录:<a href="<?php echo $all; ?>" target="_blank"><?php echo $all_num[1]; ?></a></p>
    <p>百度今日收录:<a href="<?php echo $today; ?>" target="_blank"><?php echo $today_num[1]; ?></a></p>
    <p>百度快照日期:<a href="<?php echo $all; ?>"><?php echo $screenshot[0]; ?></a></p>
</body>
</html>

[!--infotagslink--]

相关文章