搜索引擎是怎么样的存在?(四 信息服务模块)

信息服务有很多种形式,而搜索引擎的服务主要体现在信息查询之上。

信息查询流程: 接收检索词->分解检索词->匹配(响应)->输出

接收检索词需要一个接口,也就是你们常看到的文本框,它与检索器相连。

用户输入检索词后,接口获取数据,自动调用分词模型,将一个查询语句分解成多个词的集合,再与搜索引擎本身建立的规范化词表相匹配,利用之前的倒排索引寻找文档,但系统怎么就知道用户输入的查询语句与系统内部的某篇文档相匹配呢,事实就是,在两方的匹配过程之中,会用到一些算法和模型,比如向量空间模型,计算两者的相似性达到匹配的目的。

当系统获得匹配文档之后,他会检查该文档结果集中与用户输入的查询语句相关的位置与词频以及URL链接的质量,然后以权值从小到大,倒序输出,形成列表(我们眼见的动态网页)。

青年 ---------------

735 声望
186 粉丝
0 条评论
推荐阅读
PHP手写MVC (五)—— 路由
路由是一个框架中必不可少的组件,其作用是把 URL 按照预定规则解析到特定控制器中。 我们在这里定义了两种路由规则: 查询字符串。在路径后面使用问号加参数,多个参数用 & 分隔。在配置文件使用 querystrin...

entner4阅读 3.3k

Mysql索引覆盖
通常情况下,我们创建索引的时候只关注where条件,不过这只是索引优化的一个方向。优秀的索引设计应该纵观整个查询,而不仅仅是where条件部分,还应该关注查询所包含的列。索引确实是一种高效的查找数据方式,但...

京东云开发者2阅读 924

封面图
ElasticSearch必知必会-基础篇
定义: 相同文档结构(Mapping)文档的结合 由唯一索引名称标定 一个集群中有多个索引 不同的索引代表不同的业务类型数据 注意事项: 索引名称不支持大写 索引名称最大支持255个字符长度 字段的名称,支持大写,...

京东云开发者2阅读 544

封面图
跟烤冷面一起做SEO实验:开篇词
我可怜的网站一切的起因都源于我去年年底创建的网站 腐蚀脚本,既然建立了网站,总是希望有人看的,然而事实就是这么残酷,我的博客真的没有多少观众老爷捧场 0.0这里我也不管我那可怜的自尊心了,给大家看看网站...

烤冷面阅读 511

ChatGPT集成之前,让我们复习一下即将过时的知识
各大搜索引擎集成 ChatGPT 的步调已经在逐步加紧了。也许这将极大的改变搜索引擎的生态。那么就让我们在时代迎来巨变之前,复习一下即将过时的搜索引擎知识吧。

newbe36524阅读 286

封面图
ChatGPT 不是黑魔法,“替代搜索引擎”言之尚早
整个 LLM 和搜索领域都已经在过去几个月内发生了翻天覆地的变化。ChatGPT 不再是一个玩具,它开始被微软、谷歌集成在搜索以及各个 SaaS 服务中,且取得了令人惊叹的效果。

Zilliz阅读 266

封面图
为SEO提供基础的软硬件设施
取一个简短而又令人难忘的域名名字非常重要,域名最好和网站的名字一致,不但利于 SEO,同时也帮助用户在忘记收藏你网站时,通过网站名联系到网站地址(比如百度和baidu.com)。

烤冷面阅读 231

封面图

青年 ---------------

735 声望
186 粉丝
宣传栏