信息服务有很多种形式,而搜索引擎的服务主要体现在信息查询之上。

信息查询流程: 接收检索词->分解检索词->匹配(响应)->输出

接收检索词需要一个接口,也就是你们常看到的文本框,它与检索器相连。

用户输入检索词后,接口获取数据,自动调用分词模型,将一个查询语句分解成多个词的集合,再与搜索引擎本身建立的规范化词表相匹配,利用之前的倒排索引寻找文档,但系统怎么就知道用户输入的查询语句与系统内部的某篇文档相匹配呢,事实就是,在两方的匹配过程之中,会用到一些算法和模型,比如向量空间模型,计算两者的相似性达到匹配的目的。

当系统获得匹配文档之后,他会检查该文档结果集中与用户输入的查询语句相关的位置与词频以及URL链接的质量,然后以权值从小到大,倒序输出,形成列表(我们眼见的动态网页)。


entner
751 声望187 粉丝

青年 ---------------