探究搜索引擎收录网站的原理
作者: 本站编辑 发布时间: 2013-01-09 来源: 本站
深圳七达通科技:搜索引擎要知道网上的新生事物,就得派人出去搜索。雅虎创办初期,许多编辑天天泡在网上,访问新鲜网站,然后将搜集来的信息整理成序。当时的网站数量少,做起来比较容易。而现在这样做几乎不可能完成这样的搜集任务,因为现在的网站信息爆发量太大了。所以,搜索引擎的发明者就设计了计算机程序,派它来执行这个任务。
探测器有多种叫法,也叫crawler(爬行器)、spider(蜘蛛)、robot(机器人)。七达通科技公司认为这些形象的叫法是描绘搜索引擎派出的蜘蛛机器人爬行在互联网上探测新的信息。谷歌把它的探测器叫做Googlebot,百度叫做Baiduspider,MSN叫做MSNbot,而Yahoo 则称为Slurp.这个探测器实际上是人们编制的计算机程序,由它不分昼夜潜入各个网站,取回网站内容、标签、图片等,然后依照搜索引擎的算法给他们制定成索引。所以,深圳七达通科技认为用爬行来形容并不恰当,因为它们是以光速访问的。
一个搜索引擎会同时派遣出许多探测器。这些机器人或者从站主直接呈递的网站URL去访问,或者由一个网络用户所装的搜索引擎工具栏(比如谷歌工具栏)得知用户去的网站,或者是从一个网站中指向另一个网站的链接过去。探测器不一定是从网站的首页进入访问的,所以,如果你要探测器访问你其他的网页,那么这个进入页就需要和其他网页相连。深圳七达通科技:达到这个目的最容易的办法就是在每一页都加入指向首页的链接。
蜘蛛爬行取回网页信息后,会放在一个控制器里,到这一步,控制器把搜集的网页放出,我们就可以看到收录了,当然,深圳 七达通 科技告诉你:搜索引擎还会进行一个信息检索分类,并按照用户搜索返回数据和网页的排名相关信息计算,整理放在数据库,这个就是搜索引擎的复杂排名算法,这样,当用户搜索某个词时,数据库会调出返回的数据。
深圳 七达通 科技,专业的网络营销实施专家,为你打造以网站为平台的营销设计,提供企业网站,品牌网站建设,外贸网站建设,营销网站设计,网站推广,我们为企业打造一体化网络营销服务,万家客户的选择,你也值得拥有。