【SSL证书】提升搜索引擎排名策略
在竞争激烈的互联网世界中,企业总在寻找提升网站曝光率的有效方法。除了优化内容和外链建设,一个常被忽视却至关重要的工具——SSL证书,正在悄然成为搜索引擎排名优化的“隐形推手”。
2025-02-28
多模态搜索的未来:超越关键字和向量的混合搜索!
二十年前,“混合”一词仅在植物学和化学领域使用。如今,“混合”这个概念在搜索领域一片繁荣,许多搜索系统都在推出基于 AI 技术的混合搜索方案。但是,“混合搜索”是真的具有应用价值,还只是流行的一阵风呢?
2023-02-08
MySQL Explain详解
概述explain是MySQL中的一个关键字,可以用于模拟优化器执行SQL语句,分析你的SQL的性能瓶颈。使用时只需将该关键字加在sql头部,如 {代码...} 案例explain返回的结果有许多字段,我们又当如何理解呢?以下有张员工记录表,联合索引:name_age_position {代码...} 执行sql {代码...} explain结果现在,可以简单解读以下...
2023-01-29
“银河护卫队总部”放大招!Milvus 核心组件再升级,主打就是一个低延迟、高准确度
Knowhere 是什么?如果把向量数据库整体看作漫威银河护卫队宇宙,那么 Knowhere 就是名副其实的总部,它的主要功能是对向量精确搜索其最近邻或通过构建索引进行低延迟、近似的最近邻搜索(ANNS)。
2023-09-06
如何又快又好实现 Catalog 系统搜索能力?火山引擎 DataLeap 这样做
DataLeap 是火山引擎数智平台 VeDI 旗下的大数据研发治理套件产品,帮助用户快速完成数据集成、开发、运维、治理、资产、安全等全套数据中台建设,降低工作成本和数据维护成本、挖掘数据价值、为企业决策提供数据支撑。火山引擎 DataLeap 的 Data Catalog 系统通过汇总和组织各种元数据,解决了数据生产者梳理数据、数据...
2023-02-02
ES之Lucene中的段文件
Elasticsearch 是基于 Lucene 实现的,Lucene 中引入了按段搜索的概念,每一个段本身就是一个倒排索引。索引在 Lucene 中除表示所有段的集合外,还增加了提交点(Commit point)的概念,一个列出了所有已知段的文件的描述如下图:一个 Lucene 索引包含一个提交点和三个段。
2022-06-23
谷歌 AI 革命狂飙!Gemini 2.5 搜索引擎即将横扫搜索市场,颠覆你的认知
随着 5 月 20 日至 21 日谷歌 I/O 开发者大会的脚步临近,一则重磅消息在科技业界引发强烈震动 —— 谷歌正紧锣密鼓地筹备推出基于 Gemini 2.5 的下一代 AI 搜索引擎,这场变革将彻底颠覆沿用多年的传统搜索框界面。目前,这一全新搜索模式已悄然进入灰度测试阶段,标志着谷歌决心将其最重要的流量入口全面切换至 AI 驱动...
2025-05-20
Linux 文件搜索命令find,grep
-type d 目录-type p 管道-type l 符号链接-name "文件名" 要搜索的文件名还可以用 -iname 进行大小写无关的搜索
纯干货!互联网人必备的6大专业搜索工具!
百度或者google虽然可以提供海量信息,但甄选信息可是一件非常麻烦的事情。如果你想用更垂直更方便的搜索工具,请看下面6个。在一定程度上,它们能帮你摆脱仗势欺人的百度,还能比别人搜到更多资源。基于大家日常上网的需要,分类整理了不同的检索需求工具:主要包括图片、电子书、音乐、网盘、商品价格以及工作机会检索...
NLP技术如何为搜索引擎赋能
在全球化时代,搜索引擎不仅需要为用户提供准确的信息,还需理解多种语言和方言。本文详细探讨了搜索引擎如何通过NLP技术处理多语言和方言,确保为不同地区和文化的用户提供高质量的搜索结果,同时提供了基于PyTorch的实现示例,帮助您更深入地理解背后的技术细节。关注TechLead,分享AI全维度知识。作者拥有10+年互联网...
2023-11-13
给全文搜索引擎Manticore (Sphinx) search 增加中文分词
Sphinx search 是一款非常棒的开源全文搜索引擎,它使用C++开发,索引和搜索的速度非常快,我使用sphinx的时间也有好多年了。最初使用的是coreseek,一个国人在sphinxsearch基础上添加了mmseg分词的搜索引擎,可惜后来不再更新,sphinxsearch的版本太低,bug也会出现;后来也使用最新的sphinxsearch,它可以支持几乎所有...
2019-04-01
docker部署mongo 4.*集群
前言 为了在测试环境部署新项目,决定使用docker搭建一条mongo集群数据。准备 三台测试环境服务器ip操作系统192.168.188.7centos7192.168.188.129centos7192.168.188.144centos7<!--more-->部署==========以下每台都执行===================================安装过程=================镜像 {代码...} 查看版本:...
TiDB 源码阅读系列文章(十三)索引范围计算简介
在数据库中处理查询请求时,如果可以尽早的将无关数据过滤掉,那么后续的算子就可以少做无用功,提升整个 SQL 的执行效率。过滤数据最常用的手段是使用索引,TiDB 的优化器也会尽量采用索引过滤的方式处理请求,利用索引有序的特点来提升查询效率。比如当查询条件为 a = 1 时,如果 a 这一列上有索引,我们就可以利用索...
面试官灵魂拷问:什么是MySQL索引?为什么需要索引?
我们每天都在访问各种⽹站、APP,如微信、QQ、抖⾳、今⽇头条、腾讯新闻等,这些 东西上⾯都存在⼤量的信息,这些信息都需要有地⽅存储,存储在哪呢?数据库。
2021-03-31
开源向量数据库比较:Chroma, Milvus, Faiss,Weaviate
语义搜索和检索增强生成(RAG)正在彻底改变我们的在线交互方式。实现这些突破性进展的支柱就是向量数据库。选择正确的向量数据库能是一项艰巨的任务。本文为你提供四个重要的开源向量数据库之间的全面比较,希望你能够选择出最符合自己特定需求的数据库。
2024-04-25
Solr vs. Elasticsearch谁是开源搜索引擎王者
当前是云计算和数据快速增长的时代,今天的应用程序正以PB级和ZB级的速度生产数据,但人们依然在不停的追求更高更快的性能需求。随着数据的堆积,如何快速有效的搜索这些数据,成为对后端服务的挑战。本文,我们将比较业界两个最流行的开源搜索引擎,Solr和ElasticSearch。两者都建立在Apache Lucene开源平台之上,它们的...
「生产事故」MongoDB复合索引引发的灾难
前情提要11月末我司商品服务的MongoDB主库曾出现过严重抖动、频繁锁库等情况。由于诸多业务存在插入MongoDB、然后立即查询等逻辑,因此项目并未开启读写分离。最终定位问题是由于:服务器自身磁盘 + 大量慢查询导致基于上述情况,运维同学后续着重增强了对MongoDB慢查询的监控和告警幸运的一点:在出事故之前刚好完成了...