搜索引擎是怎样的存在(一 总览)
生活中总有些东西,我们触手可及,感觉平凡无奇,但却又实实在在说不出其中的奥妙,搜索引擎(Search Engines)便是其一。
搜索引擎是什么?干什么?组成?
搜索引擎(Search Engines)本质上是一款软件应用。
部分专家、学者给一长串的定义,无非是充分挖掘其内涵,扩展其外延,或保持审慎的求学态度,或玩弄文字游戏。
搜索引擎(Search Engines)的出现就是为了去搜集、捕捉网络信息,然后整理,存储,再输出。所以,它基本可以由3部分构成信息搜集模块、信息处理模块、信息服务模块。当然,每一个模块各自有其子模块,我会在后面介绍。
在这里我们需要注意两点
返回的列表信息,是搜索引擎提前"封装"好了的,不需要即时访问各个服务器
当你点击列表信息时,指向的又是原始网页,所以与你在列表中看到的,不一定相同,这也解释了为什么有的链接总在"欺骗"我们
以上,我们介绍了搜索引擎是什么,干什么用,怎么组成,下面我们再来看看作为一款软件,它的系统结构是怎样的?
直接上图:
可以看出,在系统结构这一层面上,它又可以将三层模块划分为上、下两部分(后面细说)。
在第二节,我会从以下3个方面讲一讲搜索引擎第一个模块——信息搜索模块。
1.爬虫
2.建立服务器连接
3.通信请求
写在后面
现代人几乎都离不开搜索引擎,尤其是程序员,开机就用,怎么能不了解一下搜索引擎的工作原理:)
推荐阅读
PHP手写MVC (五)—— 路由
路由是一个框架中必不可少的组件,其作用是把 URL 按照预定规则解析到特定控制器中。 我们在这里定义了两种路由规则: 查询字符串。在路径后面使用问号加参数,多个参数用 & 分隔。在配置文件使用 querystrin...
entner赞 4阅读 3.3k
Mysql索引覆盖
通常情况下,我们创建索引的时候只关注where条件,不过这只是索引优化的一个方向。优秀的索引设计应该纵观整个查询,而不仅仅是where条件部分,还应该关注查询所包含的列。索引确实是一种高效的查找数据方式,但...
京东云开发者赞 2阅读 924
ElasticSearch必知必会-基础篇
定义: 相同文档结构(Mapping)文档的结合 由唯一索引名称标定 一个集群中有多个索引 不同的索引代表不同的业务类型数据 注意事项: 索引名称不支持大写 索引名称最大支持255个字符长度 字段的名称,支持大写,...
京东云开发者赞 2阅读 544
跟烤冷面一起做SEO实验:开篇词
我可怜的网站一切的起因都源于我去年年底创建的网站 腐蚀脚本,既然建立了网站,总是希望有人看的,然而事实就是这么残酷,我的博客真的没有多少观众老爷捧场 0.0这里我也不管我那可怜的自尊心了,给大家看看网站...
烤冷面阅读 511
ChatGPT集成之前,让我们复习一下即将过时的知识
各大搜索引擎集成 ChatGPT 的步调已经在逐步加紧了。也许这将极大的改变搜索引擎的生态。那么就让我们在时代迎来巨变之前,复习一下即将过时的搜索引擎知识吧。
newbe36524阅读 286
ChatGPT 不是黑魔法,“替代搜索引擎”言之尚早
整个 LLM 和搜索领域都已经在过去几个月内发生了翻天覆地的变化。ChatGPT 不再是一个玩具,它开始被微软、谷歌集成在搜索以及各个 SaaS 服务中,且取得了令人惊叹的效果。
Zilliz阅读 266
为SEO提供基础的软硬件设施
取一个简短而又令人难忘的域名名字非常重要,域名最好和网站的名字一致,不但利于 SEO,同时也帮助用户在忘记收藏你网站时,通过网站名联系到网站地址(比如百度和baidu.com)。
烤冷面阅读 231
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。