揭开神秘面纱,搜索引擎原理浅析

 更新时间:2016年9月20日 19:03  点击:2177

    在浩如烟海的Internet上,特别是其上的Web(World Wide Web万维网)上,不会搜索,就不会上网。网虫朋友们,你了解搜索引擎吗?它们是怎么工作的?你都使用哪些搜索引擎?今天我就和大家聊聊搜索引擎的话题。

  一、搜索引擎的分类

  获得网站网页资料,能够建立数据库并提供查询的系统,我们都可以把它叫做搜索引擎。按照工作原理的不同,可以把它们分为两个基本类别:全文搜索引擎(FullText Search Engine)和分类目录Directory)。

  全文搜索引擎的数据库是依靠一个叫“网络机器人(Spider)”或叫“网络蜘蛛(crawlers)”的软件,通过网络上的各种链接自动获取大量网页信息内容,并按以定的规则分析整理形成的。Google、百度都是比较典型的全文搜索引擎系统。

  分类目录则是通过人工的方式收集整理网站资料形成数据库的,比如雅虎中国以及国内的搜狐、新浪、网易分类目录。另外,在网上的一些导航站点,也可以归属为原始的分类目录,比如“网址之家”(http://www.hao123.com/)。

  全文搜索引擎和分类目录在使用上各有长短。全文搜索引擎因为依靠软件进行,所以数据库的容量非常庞大,但是,它的查询结果往往不够准确;分类目录依靠人工收集和整理网站,能够提供更为准确的查询结果,但收集的内容却非常有限。为了取长补短,现在的很多搜索引擎,都同时提供这两类查询,一般对全文搜索引擎的查询称为搜索“所有网站”或“全部网站”,比如Google的全文搜索(http://www.google.com/intl/zh-CN/);把对分类目录的查询称为搜索“分类目录”或搜索“分类网站”,比如新浪搜索(http://dir.sina.com.cn/)和雅虎中国搜索(http://cn.search.yahoo.com/dirsrch/)。

  在网上,对这两类搜索引擎进行整合,还产生了其它的搜索服务,在这里,我们权且也把它们称作搜索引擎,主要有这两类:

  ⒈元搜索引擎(META Search Engine)。这类搜索引擎一般都没有自己网络机器人及数据库,它们的搜索结果是通过调用、控制和优化其它多个独立搜索引擎的搜索结果并以统一的格式在同一界面集中显示。元搜索引擎虽没有“网络机器人”或“网络蜘蛛”,也无独立的索引数据库,但在检索请求提交、检索接口代理和检索结果显示等方面,均有自己研发的特色元搜索技术。比如“metaFisher元搜索引擎”
(http://www.hsfz.net/fish/),它就调用和整合了Google、Yahoo、AlltheWeb、百度和OpenFind等多家搜索引擎的数据。

  ⒉集成搜索引擎(All-in-One Search Page)。集成搜索引擎是通过网络技术,在一个网页上链接很多个独立搜索引擎,查询时,点选或指定搜索引擎,一次输入,多个搜索引擎同时查询,搜索结果由各搜索引擎分别以不同页面显示,比如“网际瑞士军刀”(http://free.okey.net/%7Efree/search1.htm)。

第一条:网站优化最重要的是网站内容要准确定位客户,这一点是网站是否能吸引您真正期望的访问者的直接因素。
  
  第二条:精心选择和网站主题及所瞄准的时常相关的关键字。
  
  第三条:尽量在网站内容中利用选择的关键字,值得注意的是,关键字尽量出现在内容的前面部分。
  
  第四条:网站的标题中一定要包含您认为最为重要的关键字。
  
  第五条:在头部标记中尽量运用关键字,将帮助网站在基于该关键字在搜索结果中的排名。
  
  第六条:尽量为图像加上ALT标记,在该标记中包含必要的关键字。
  
  第七条:千万别让关键字的颜色和网页背景颜色相同,搜索引擎将认为是恶意行为(SPAM)。
  
  第八条:务必使用您自己的域名和主机,不要使用免费的二级域名,这样显得不很专业,影响搜索引擎的影响。
  
  第九条:资金允许的话,抢注您的域名的变种,以防别的网站利用您的域名的变异域名而受益。
  
  第十条:有可能的话,将您的关键字包含在域名中,这样可以提高在搜索引擎中的排名,这样也许会损失一点品牌形象。
  
  第十一条:尽量用和相应页面内容相关的关键字命名页面文件名。
  
  第十二条:尽量不要把页面放在长结构的目录中,最好把大多数页面放在顶级目录或一级子目录中。
  
  第十三条:假如您开始一个新的网络业务,如果有可能的话,让关键包含在新业务的名称中。
  
  第十四条:建立一个看起来比较专业的网站,网站是您服务甚至是公司的门面,一个专业的网站可以啬客户的信任度。
  
  第十五条:测试您的网站,确保在IE,Netscape,及Mac兼容。
  
  第十六条:在提交搜索引擎前检测您的网站,确保没有死链接。
  
  第十七条:尽量减少排字、拼写及语法上的错误。
  
  第十八条:尽量保证在网站的每个页面上都有返回主页的链接按钮或文本链接。
  
  第十九条:网站的首页应该设计成下载速度较快的方式,避免在主页上运用FLASH或过多的图像,搜索引擎不能检索图像。
  
  第二十条:在网站的每个页面上使用普通的导航菜单。
  
  第二十一条:可以让客户很容易地找到定单位置,而且保证是可用的。测试定单处理的每个阶段。
  
  第二十二条:鼓励其他网站和你的网站交换链接,啬网站的外部链接(Link Popularity),有利于搜索引擎的搜索。
  
  第二十三条:记住Google把任何Cloaking都认为是SPAM。cloaking-为一个单一的目的,人为地设计一条。
  
  第二十四条:为网站建立一个网站地图,这有利于访客和搜索引擎看到网站的的所有页面。
  
  第二十五条:在单独的文件中旋转样式表及javascript代码,主体部分前面包含关键字的代码越少越好。


< 教你如何肉眼识别网站流量大小(交换链接必杀技巧)
  咋才能知道对方的流量呢?
  如果您不是太菜的话略过这一段:记得先前有一些无良的人,采用在自己页面最下方放一个累加器的土办法,显示的数儿,贼忒高,类似的做法好像流量了一段,咱告诉您,这是绝不可相信的。信了,那您就{ 揍}是一浓,没跑了。

  咱解释几个词儿给您先,众位看管瞅好:
  头一号:独立用户,介个代表您内网站一天来了几票活人,自然是越多越好。
  二一号:独立IP,介个代表您内网站一天来的那些个票活人用了多少个IP地址,自然,同样多多益善。
  三一号:网站页面流量,介个也叫PV,证明您内网站一天被刷了几下。
    
  咱要看的,系独立用户流量或者是独立ip流量,介都是不太容易作假的。
  内位说了:咋看呢?

    您瞅准喽:蓝天六必治.....

  一、如果对方使用了公开数据的统计系统,此数据,基本上为最具价值的参考值。如果对方比较大度,肯让咱看来路,不妨好好看看,来路越多、从地址栏或者收藏家访问越多站的广告价值越高;当然,如果对方肯给咱看真是流量统计的话,逆火个人认为其人颇仗义,就算赔了,不妨就当咱交个朋友。一般来讲,各种统计的相差不大。此中有个事儿:如果从地址栏或者收藏家访问超过了90%,此站毫无疑问为病毒作弊站,实践证明,病毒站的要价比较低,而且广告效果也不错,请自行考虑是否与其合作,个人不推荐;最后请看官们注意!严重注意!!只要是某某网站自己搞的联盟无论是XXXX宽带联盟、XXxx短信联盟或者XXXXX搜索联盟,他们给出的统计数据,一律是狗P,千万不要予以信任,对方以此为据时,建议以长江大河之气势,痛骂之无品格、无人格、无国格、无性格。一定记住,只能相信那些与站长利益一致的中间联盟平台,比如亿起发联盟商务平台(www.eqifa.com)和好耶的智易什么的!

  二、如果对方不给咱看统计数据,逆火个人认为其居心有10%的可能性为叵测。此时完全无需慌张,只需施展六必治神功的第二层境界。走访各大网址站寻找之,像hao123、haourl、265、516这些家伙,虽然已经利欲熏心、堕落到了比较无良的地步,但为了保全性命,还有一线良知尚存,他们可住我等练成第二层的神功。如果他们首页收录了对方,对方必是网际绝顶高手,流量已达骇人听闻之境地。当然了,一般肯和咱合作的,还没有牛B到这个境界,但只要被这些站的2级页面收录了,一般讲,ip也有可能过6位数,至少5位是不成问题的。如果对方连进都没有进这些著名的网址站,必是一贩夫走卒无疑,请索要对方近照,细观其双眼,观察是否有凶光放出...

  三、另有一法,利用现今受千夫横指、万人唾骂的Alexa。Alexa之所以不死,只因尚有些网友利用逆火我这独门法决凭Alexa判敌之流量真伪。Alexa咱都知道吧,就{ 揍}系自以为是世界网站最权威评定者的那群外国super粪青。在地址栏输入http://www.alexa.com/data/details/traffic_details?q=&url= “对方网站的网址”。在出现的Alexa网站信息参考页面中,有一项“每百万人来访者Reach per million users“,这项使者的我们注意的,它代表了通过Alexa的估计,要注意看这个网站的三月平均值 3 mos. Avg.,如果他的今日值或本周值 [ 别说你不认识今日的英文是today、周的英文是week!!!我喷血在屏幕上]高于三月平均值太多,或者排名图(reach图代表来访、rank图代表世界排名、PageViews图代表被刷新率)呈现十分明显的锯齿或垂直于时间轴的直线。建议采用观察法诊断对方是否有人品问题。
    如非这样,
  解:根据Alexa自己的说法,世界上有3亿地球人使用国际互联网。设Alexa 3 mos. Avg Reach per million users(3月以来平均日来访者) = X
  此网站的日独立ip为A。
  那么,世界上最最无良、最最丧智的王8级数学换算公式如下:
  未知数 A = 300000000 * X / 1000000
  实测证明,此公式绝非无稽之谈,它的准确性介于10%~1000%之间,因此并不要带着对Alexa深恶痛绝的惯性心里认为此公式并非完全没有用处。至少,它可以帮助你在2位十进制数的数量级误差间的大概取值可能范围。也还可以在完全没辙得知对方流量的的情况下帮你一道。嘿嘿。最后重申一下,Alexa排名是可以在短时间内提得很高的,不要过分迷信它。

  看来大家还是需要类似技巧的,继续写下:
    续:

  四、对比观察法。一般来讲,网站总是有友情链接的,这是一个露马脚的地方,绝大多数的网站都是和自己流量详尽的网站进行友情链接的。如果对方友情链接的网站你一个都没瞅见过,那么对方是个蒙人的主儿。有时,对方故意链一些大战蒙骗你,者也好办,只要看对方链没链他就可以了。我们可以借鉴一下跳水的办法。将其中去掉一个最高值,去掉一个最低值,去掉最靠前的和最靠后的(有可能是照顾的或者是作假的),将剩下的取平均值,即可得出结论。另外,有些展会在友情链接的位置提出友情链接的标准,这个标准,一般就和其自身的流量相差不远。(比如XX榜首页就有类似的)。
    
  五、关键词反推法 一、保持网页的朴素

  一个好的网站最重要的一点就是界面的简单、朴素。你听说过“KISS”法则吗?
  “Keep It Simple Silly.”适用于所有的站点。

  制作者们很容易掉入这样一个陷阱,即把所有可能用到的网页技巧,例如:框架、表格、字体、GIF动画等等都用上,这当然是好的,但如果多了的话就会让你的访问者眼花缭乱,不知所措,也不会给他们留下很深的印象。

  记住,只是因为你可以创建一个效果,但并不意味着你必须创建这个效果。先问一问你自己:我在网页上加入这个技术有什么价值?是否能更好的向访问者表达我的主题?

  二、简单并不等于乏味

  简单的真正含义并不是迟钝和乏味。许多人会被网站多余的奇特效果所迷惑,而忽视了信息的有效性。

  保持简单的真正含义就是:想一想如何使自己网站的信息与你的访问者所期待和所需要的一样。应该把技术和效果用在适当的地方,用在有效信息上,让访问者关注他们想关注的东西。

  清晰的设计+有效的技术=一个好的站点

  三、了解你的读者

  你不是在真空里制作你的网页,也不是作给你自己看的。如果是这样,你还不如把它放在自己的电脑里。你发布你的网站是希望某些人停下来参观它。而这些人就是你的读者。

  你越了解你的读者,你的网站影响力就会越大。你的读者是否有个慢猫?那你最好应当特别的注意网页的大小;他们希望听到音乐片断吗?你就要想想网页上的音乐格式。你的读者是纺织工人?那么血红色和黑色最好不要选择;或者他们是骨灰级游戏玩家?你就要避免用柔和的颜色和图案了。

  一个好站点的定义:通过典雅的风格设计提供给潜在读者高质量的信息。

  四、五个“手指”

  对一个好的网站来说,清晰的导航也是最起码的标准。应该让访问者知道自己当时在网站中的位置,并且愉快的通过你的指引而遍览你的网站。例如,你可以做到的一件事情就是:“下一步”的选择数目尽量少,以便人们不会迷失在长长的选择项目列表中。

  你知道吗?一般人的大脑把五个或更少的项目看作一组,但是当所面对的项目超过五个,它就必须把他们划分成较小的次组来处理,所以说,保持你的选择项归类在五组或五组以内就变得很有意义了。你的访问者能够快速的找到自己想选择的项目。

  五、三次点击

  对网站制作者来说,访问者就是上帝,讨好上帝的另一个方法就是让他们在获取信息时不要超过三次点击。想想,当你在访问一个网站时,点击。。。点击。。。点击。。。再点击。。。再。。。才找到你想要的信息,或者还没找到,你会怎么想呢?

  加之,当你的访问者深入网站查找需要的信息最后却摸不着头脑了,会怎么办?他们肯定不会原地兜圈,他们会离开你的主页去别的地方继续冲浪,可能也就再也不会回来了。

  六、 三十秒的等待时间

  访问者进入你的站点后,他应该可以不费力的找到所需要的资料。有一条不成文的法则:当访问者在决定下一步该去哪之前,不要让他现在所看的页面下载的时间超过30秒钟。如果超过了这个时间,你就会开始失去你的“上帝”了。

  保证你的页面有个适度的大小而不会无限制的下载。如果你的大多数访问者使用Modem的话,试着保持总的页面大小(包括页面图像)在45K一下。

  确保你的页面设计规划清晰明了,让访问者只需快速的扫视就能把握你的网站导航,知道自己“下一步”该选择的项目。

  七、平衡

  平衡是一个好网站设计的重要部分。

  文本和图像之间的平衡。除非内容决定了这是个完全文本或者完全图像的网站,你需要用直觉和审美观来作判断,以便其中的一个不会淹没另外一个。

  下载时间和页面内容之间的平衡。当然你希望有个漂亮的页面,但你也必须平衡你的页面内容,因为你的很多访问者正在通过modem阅读它。难道你网站的图片真的值得等待那么久吗?

  背景和前景之间的平衡。我们能在白纸上画出美丽的图案,网页上,如果能制作出漂亮的结构和背景是很令人激动的。但也容易使你的内容淹没在你的背景里面。

  八、适度的帧

  适度的的帧对于你的网页是很好的补充,然而就像所有网站的元素所具有的特性一样,你绝对不要滥用他们!

  如果你想创建一个可以看得到的导航结构,比如说一个表格目录,帧就是一个很合适的途径,例如,这页有三个帧--你现在所看到的内容,导航条在右边,题目、广告和说明栏在顶部。

  但是帧不是“万金油”。比如说,如果你想用行或列来显示信息的话,表格会更好。

  九、坚持学习

  创建网页是一个不断学习的过程。推出你网站的第一个版本还只是一个开始!技术和工具在不断的进步,而我们对人们如何利用网上资源的方式的了解也是在不断的变化,要创建一个好网站你就不能陶醉在过去的成绩上。

  看看其他的网站。如果你想成为一个出色的小说家的话,你必须不断阅读其他好的作品。如果你想成为一个出色的剧作家的话你必须多看好的电影。同样,如果你想设计一个出色的网站的话,你必须多看其他好的网站 普通的Google登陆办法就是通过Google登录页面向Google搜索引擎提交.
  地址:http://www.google.com/intl/zh-CN/add_url.html
  
  虽然一般而言,只要提交了一个页面,Google会自动搜索到你其他的页面,但是如果你的页面连接是图片或者FLASH按钮等,你最好还是将主要页面都向GOOGLE提交一下。就算你的是文字连接,也可以多次向GOOGLE提交的,反正没有什么坏处。
  
  检验Google是否收录你页面的办法很简单。比如检查www.jjt8.com 是否被Google收录,你只需要在GOOGLE搜索筐输入:site:www.jjt8.com 就可以知道你的网站是否被GOOGLE收录,以及被GOOGLE收录了多少页面等等。
  
  这个方法登陆Google一般没有你想想的那么快,短了三五天,长了就难说了。 那么如何最快的让Google收录你的网站呢?
  
  最简单的办法就是在流量非常大,Google天天光顾的网站或者网页上做超连接,文字连接效果最好! 这招虽然比普通的登陆办法麻烦些,但是效果是非常明显的。这种连接越多越好,不光可以让你快速的被GOOGLE收录,而且还可以快速的在Google中提升你网站的的PageRank
  
  很多朋友一谈到GOOGLE排名,总以为它是单一的网页标签优化处理,其实,这种观点是错误的。
  
  做GOOGLE排名服务,要做的有以下几步工作:
  
  第一步:网站诊断,包括:
  
  网站结构诊断:看其是否适合搜索引擎习惯;
  
  网站页面诊断:看其是否布局合理,处理得当;
  
  网站文件名诊断:看其是否用了不合理的文件名;
  
  网站营销基础诊断:看其目前所用的网络推广方面是否合理。
  
  第二步:网站基础流量分析:
  
  流量统计系统安装
  
  流量来路分析,
  
  地区分布分析,
  
  第三步:网站优化处理:
  
  网站结构优化:让网站结构合理化,以适合搜索引擎习惯
  
  网站页面优化:关键词布局,图文处理等。
  
  网站连接优化:让网站整体的连接系统化,一方面有助于搜索引擎搜索,一方面结合用户习惯,引导用户来看网站的内容,以促成最后的生意成交。
  
  网站标签优化:网站标签设计,优化。
  
  第四步:GOOGLE排名其他策略:
  
  制造流量:GOOGLE排名关键还是流量啊,这个过程中我们会用到许多网络营销方法。
  
  制造外部连接:通过友情连接,文章宣传,帖子宣传等等各种方式提高网站外部里连接。
  
  其他… …
  
  网站要想再GOOGLE排名做的好,首先要自身做的好,推广好,才能取得较好的排名。所以对网站进行GOOGLE排名要站在综合营销的角度来考虑,然后去做。这样才能达到效果。
  
  如果想靠单一的标签优化,以及作弊手段达到GOOGLE排名考前的效果,那是十分幼稚可笑的。
  
  毕竟,GOOGLE排名还是为了推广网站。那么,网站的综合推广做好了,可以在google取的较好的排名就是情理之中的事了。

SyntaxHighlighter.highlight();
[!--infotagslink--]

相关文章

  • MySQL中的联合索引学习教程

    联合索引又叫复合索引。对于复合索引:Mysql从左到右的使用索引中的字段,一个查询可以只使用索引中的一部份,但只能是最左侧部分。例如索引是key index (a,b,c). 可以支持a | a,b| a,b,c 3种组合进行查找,但不支持 b,c进...2015-11-24
  • MySQL中的唯一索引的简单学习教程

    mysql 唯一索引UNIQUE一般用于不重复数据字段了我们经常会在数据表中的id设置为唯一索引UNIQUE,下面我来介绍如何在mysql中使用唯一索引UNIQUE吧。 创建唯一索引的目的不是为了提高访问速度,而只是为了避免数据出现重复...2015-11-24
  • vue+高德地图实现地图搜索及点击定位操作

    这篇文章主要介绍了vue+高德地图实现地图搜索及点击定位操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...2020-09-09
  • 站内搜索关键词变亮方法

    我们这个做法是把搜索结果出来,与搜索关键词相同的替换成高亮的字, 我们会用到str_replace(你找的关键字,你找的关键字,$str); 就这么容易了,好了下面我们来看一...2016-11-25
  • R语言 install.packages 无法读取索引的解决方案

    这篇文章主要介绍了R语言 install.packages 无法读取索引的解决方案,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...2021-05-06
  • 怎么对百度网页搜索的检索指标进行评估

    用户为满足自己某种需求而来到搜索引擎的,判断用户的需求是做好网站的开始。只有准确地判断出用户需求,了解用户搜索的目的,才能合理地衡量出一个网站结果的质量好,做好搜...2016-10-10
  • MYSQL中常用的强制性操作(例如强制索引)

    其他强制操作,优先操作如下:mysql常用的hint对于经常使用oracle的朋友可能知道,oracle的hint功能种类很多,对于优化sql语句提供了很多方法。同样,在mysql里,也有类似的hint功能。下面介绍一些常用的。强制索引 FORCE INDEX...2014-05-31
  • php搜索csv表格中是否存在指定数据

    php搜索csv中的数据原理是打开csv文件,然后一行行搜索指定的内容是否包含在我们读取这代码中,如果是返回true。 //搜索csv中指定内容 代码如下 复制代码...2016-11-25
  • 详解c#索引(Index)和范围(Range)

    这篇文章主要介绍了c#索引(Index)和范围(Range)的相关资料,帮助大家更好的理解和学习c#,感兴趣的朋友可以了解下...2020-12-08
  • pycharm 如何取消连按两下shift出现的全局搜索

    这篇文章主要介绍了pycharm 如何取消连按两下shift出现的全局搜索?下面小编就为大家介绍一下解决方法,还等什么?一起跟随小编过来看看吧...2021-01-16
  • Angular2搜索和重置按钮过场动画

    这篇文章主要介绍了Angular2搜索和重置按钮过场动画,需要的朋友可以参考下...2017-05-27
  • 基于element-ui封装可搜索的懒加载tree组件的实现

    这篇文章主要介绍了基于element-ui封装可搜索的懒加载tree组件的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧...2020-05-23
  • MySQL 索引知识汇总

    这篇文章主要介绍了MySQL 索引使用方法的相关资料,文中示例代码非常详细,帮助大家更好的理解和学习,感兴趣的朋友可以了解下...2020-07-05
  • yii2带搜索功能的下拉框实例详解

    带搜索功能下拉框在项目中经常会用到,下面小编把实现代码分享到脚本之家平台,供大家参考...2016-05-13
  • oracle索引的测试实例代码

    这篇文章主要给大家介绍了关于oracle索引测试的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧...2021-01-17
  • MySQL带你秒懂索引下推

    如果你在面试中,听到MySQL5.6”、“索引优化” 之类的词语,你就要立马get到,这个问的是“索引下推”。本文就来分分享这个小知识点索引下推...2021-09-16
  • 如何避免被搜索引擎视为作弊

      一个网站要想成功注册,它起码应具备两个条件,一是网站本身要有较好的内容和设计,二是网站没有作弊行为。这里所谓的“作弊”,是指采用一些特殊的、有悖常规的网...2016-09-20
  • PHP网络开发详解:搜索页面的设计

    PHP对于数据库的搜索主要通过使用SQL语句中的like子句来实现。如果同时搜索多个关键词,可以使用union子句来将搜索结果合并起来。以下代码实现了一个搜索页面...2016-11-25
  • php函数索引(1)

    Abs: 取得绝对值。 Acos: 取得反余弦值。 ada_afetch: 取得数据库的返回列。 ada_autocommit: 开关自动改动功能。 ada_close: 关闭 Adabas D 链接。 ada_commit: 改...2016-11-25
  • Mysql判断表字段或索引是否存在

    这篇文章主要介绍了Mysql判断表字段或索引是否存在的相关资料,非常不错具有参考借鉴价值,需要的朋友可以参考下...2016-06-12