搜索引擎介绍,它的种类与工作原理 -电脑资料

电脑资料 时间:2019-01-01 我要投稿
【www.unjs.com - 电脑资料】

   

    ①定义,

搜索引擎介绍,它的种类与工作原理

。搜索引擎(Search Engines,sE)是一个对互联网上的信息资源进行搜集整理,然后供用户查询的系统,它包括信息搜集、信息整理和用户查询三部分。

    ②搜索引擎的种类。按照搜索引擎的工作原理来划分,搜索引擎有两种基本类型:一类是纯技术型的全文检索搜索引擎,如Google、AltaVista、lnktomi等,其原理是通过机器手(即spider程序)到各个网站收集、存储信息,并建立索引数据库供用户查询;另一类称为分类目录,如Yahoo!这种搜索引擎并不采集网站的任何信息,而是利用各网站向搜索引擎提交网站信息时填写的关键词和网站描述等资料,经过人工审核编辑后,如果符合网站登录的条件,则输人数据库以供查询。

    ③搜索引擎的丁作原理。全文搜索引擎自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间(如Google一般是28天),搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网站进行检索,一旦发现新的网站。它会自动提取网站的信息和网址,并加入自己的数据库。另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网址.它在一定时间内(2天到数月不等)定向向该网站派出“蜘蛛”程序.扫描此网站,并将有关信息存人数据库,以备用户查询,

电脑资料

搜索引擎介绍,它的种类与工作原理》(https://www.unjs.com)。由于近年来搜索引擎索引规则发生了很大变化,主动提交网址并不保证网站能进入搜索引擎数据库,因此,目前最好的办法是多获得一些外部链接,让搜索引擎有更多机会找到并自动将网站收录。

    与全文搜索引擎相比,目录索引有许多不同之处。首先,目录索引完全依赖手工操作。用户提交网站后,目录编辑人员会亲自浏览此网站,然后根据一套自定的评判标准或编辑人员的主观印象,决定是否接纳该网站。其次,目录索引对网站的要求则高得多.有时即使登录多次也不一定成功,尤其像yahoo这样的超级索引,登录更是困难,此外,登录目录索引时则必须将刚站放在一个最合适的目录(Dirctory)中。最后,搜索引擎中各网站的有关信息都是从用户网负中自动提取的,所以用户拥有更多的自主权;而目录索引则要求必须手工填写网站信息,而且还有各种各样的限制。更有甚者,如果工作人员认为所提交网站的目录、网站信息不合适,他可以随时对其进行调整。而且事先是不和任何人商量。

    目前,搜索引擎与目录索引有相互融合渗透的趋势。原来一些纯粹的全文搜索引擎现在也提供目录搜索,如谷歌就借用Open Directory目录提供分类查询。而像Yah∞l这此老牌目录索引则通过与(谷歌等搜索引擎合作扩大搜索范围。在默认搜索模式下,一些目录类搜索引擎首先返回的是自己目录中匹配的网站,如搜狐、新浪、网易等。

最新文章