1、全文索引当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法(通常根据网页中关键词的匹配程度、出现的位置/频次、链接质量等),计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。
2、目录索引通过搜集和整理因特网的资源,根据搜索到网页的内容,将其网址分配到相关分类主题目录的不同层次的类目之下,形成像图书馆目录一样的分类树形结构索引。
目录索引无需输入任何文字,只要根据网站提供的主题分类目录,层层点击进入,便可查到所需的网络信息资源。
3、元搜索接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。
著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。
搜索引擎分为全文索引、目录索引、元搜索引擎和其他引擎四种。
全文搜索引擎可以从互联网提取各个网站的信息,建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。
根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的检索程序,俗称“蜘蛛”程序或“机器人”程序,能自建网页数据库,搜索结果直接从自身的数据库中调用;另一类则是租用其他的搜索引擎的数据库,并按自定的格式排列搜索结果。
目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。
元搜索引擎接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。
其他引擎主要包括集合式搜索引擎、门户搜索引擎及免费链接列表。
集合式搜索引擎类似于元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择;门户搜索引擎虽然提供搜索服务,但自身既没有分类目录也没有网页数据库,其搜索结果完全来自其他的搜索引擎;免费链接列表一般只简单地滚动链接条目,少部分有简单的分类目录。
几大搜索引擎比较:
1.Google:它是纯技术型的全文检索搜索引擎。
Google 依据网络自身结构,清理混沌信息,缜密组织资源。
Google 的搜索服务绝不仅仅是简单的信息目录。
而且Google 目录中收录了 10 亿多个网址,这在同类搜索引擎中是首屈一指的。
2.百度:它也是纯技术型的全文检索搜索引擎。
作为中文搜索引擎的老大,百度也有其及为独到的一面。
其基于字词结合的信息处理方式,就相当巧妙解决了中文信息的理解问题,极大地提高了搜索的准确性和查全率。
百度还支持主流的中文编码标准。
3.网易:它是分类目录型门户网站。
对于其他搜索引擎而言,网易搜索也有其相当独特的特点。
首先是网易搜索引擎提供多语言检索,而不仅仅是单语种的搜索。
4.搜狐:它是分类目录型门户网站。
搜狐也是一个不错的中文的搜索引擎。
<