mongodb 索引实操
向 mydoc 集合中,插入多条数据,mydoc 之前是没有存在过的,我们直接使用 db.mydoc.insertMany() ,mongodb 会默认给我们新建这个集合
2022-10-22
搜索图片有新招了!北大课题组提出图像检索新方法,输入草图or艺术or低分辨率 | ECCV 2024
北京大学袁粒课题组,联合南洋理工大学实验室,清华自动化所提出了一种新的通用检索任务:通用风格检索(Style-Diversified Retrieval)。
2024-08-22
第20篇-不和谐如何索引数十亿条消息
我的Elasticsearch系列文章,逐渐更新中,欢迎关注 0A.关于Elasticsearch及实例应用 00.Solr与ElasticSearch对比 01.ElasticSearch能做什么? 02.Elastic Stack功能介绍 03.如何安装与设置Elasticsearch API 04.如果通过elasticsearch的head插件建立索引_CRUD操作 05.Elasticsearch多个实例和head plugin使用介绍 06.当E...
2020-06-27
Oracle SQL语句之常见优化方法总结
SQL语句尽量用大写的; 因为oracle总是先解析SQL语句,把小写的字母转换成大写的再执行。 2、使用表的别名: 当在SQL语句中连接多个表时, 尽量使用表的别名并把别名前缀于每个列上。这样一来, 就可以减少解析的时间并减少那些由列歧义引起的语法错误。 3、选择最有效率的表名顺序(只在基于规则的优化器(RBO)中有效): ...
2020-03-17
消息队列Kafka「检索组件」重磅上线!
简介:本文对消息队列 Kafka「检索组件」进行详细介绍,首先通过对消息队列使用过程中的痛点问题进行介绍,然后针对痛点问题提出相应的解决办法,并对关键技术技术进行解读,旨在帮助大家对消息队列 Kafka「检索组件」的特点及使用方式更加熟悉,以期可以帮助大家更有效的解决在消息排查过程中遇到的痛点问题。
MySQL的聚簇和非聚簇索引&页分裂&页合并
聚簇索引(InnoDB)是对磁盘上的数据重新组织以按指定的一个或多个列的值排序的算法,聚簇索引的叶子节点就是其数据节点,其特点是数据的存储顺序和索引顺序一致。一般情况下默认以主键为聚簇索引,且一张表只允许存在一个聚簇索引,因为,数据一旦存储,其顺序只能有一种。如果未设置主键,会选择一个符合条件的 Unique-k...
数据结构与算法系列之跳表(GO)
详细了解跳表前边的一篇文章中分享了二分查找算法,里边有说到二分查找算法依赖数组的随机访问特性,只能用数组来实现。如果数据存储在链表中就没法用二分查找算法了本篇文章分享的「跳表」,可以实现类似二分的查找算法,时间复杂度也是「O(logn)」假设有一个有序的单链表,如果想从该链表中查找某一个数据,只能从头到...
2020-12-03
【深度剖析】MySQL B+树索引:一次查询的内部奥秘
大家好!今天我们来聊一个 MySQL 核心知识点:B+树索引的查询过程。可能你每天都在用SELECT语句查询数据,但你想过这背后到底发生了什么吗?MySQL 是怎么从成千上万的数据中快速找到你要的那一条记录的?带着这个问题,我们一起揭开 MySQL B+树索引的神秘面纱!
2025-04-19
Elasticsearch入门一
一、认识ES二、ES功能分布式、搜索(全文检索、结构化检索)、数据分析三、lucene和ES的前世今生lucene是最先进、功能最强大的搜索库,直接基于lucene开发,非常的复杂。elasticsearch,基于lucene,隐藏复杂性,提供简单易用的api接口。四、ES的核心概念Near Realtime(NRT):近实时,从写入数据到数据可以被搜索到有一个小延...
2021-03-28
巧用这几种文本检索工具,节省80%的时间!
说到文本搜索工具,大家一定会想到 grep, 它是 Linux 最有用并最常用的工具之一。grep 在我们日常的学习和工作中是必不可少的,但是,当我们需要在一个比较大的工程项目中搜索某个关键词时,grep 的效率是比较低的。
一文详解 | 开放搜索兼容Elasticsearch做召回引擎
简介:开放搜索发布开源兼容版,支持阿里云Elasticsearch做搜索召回引擎,本文详细介绍阿里云ES用户如何通过接入开放搜索兼容版丰富行业分词库,提升查询语义理解能力,无需开发、算法投入,即可获得淘系同款搜索效果。
Elasticsearch系列---Elasticsearch的基本概念及工作原理
Near Realtime,近实时,有两个层面的含义,一是从写入一条数据到这条数据可以被搜索,有一段非常小的延迟(大约1秒左右),二是基于Elasticsearch的搜索和分析操作,耗时可以达到秒级。
互联网搜索核心组件:Lucene 20 岁生日啦
你用过Elasticsearch么?那你知道Elasticsearch底层是基于什么技术演化而来的么?相信用过ES并深入了解过ES的都知道,ES是基于Lucene,隐藏复杂性,提供简单易用的restful api接口、java api接口、其他语言的接口。现在Lucene从诞生到现在已经20年了,Happy Birthday , Lucene!ES官网还特意为Lucene庆生,链接:[链接] 。
2020-04-15
可能是全网第一个使用RediSearch实战的项目
数据集建立索引后,我们使用运行在专用负载生成器服务器上的 32 个客户端启动了两个词的搜索查询。如下图所示,RediSearch 的吞吐量达到了 12.5K ops/sec,而 Elasticsearch 的吞吐量达到了 3.1K ops/sec,快了 4 倍。此外,RediSearch 的延迟稍好一些,平均为 8 毫秒,而 Elasticsearch 为 10 毫秒。(ops/sec每秒操作数)
2022-04-06
【JVM学习】Class字节码文件结构
class字节码文件结构类型名称说明长度数量u4magic魔数,识别Class文件格式4个字节1u2minor_version副版本号(小版本)2个字节1u2major_version主版本号(大版本)2个字节1u2constant_pool_count常量池计数器2个字节1cp_infoconstant_pool常量池表n个字节constant_pool_count-1u2access_flags访问标识2个字节1u2this_class类索...
2020-10-19
导航和搜索之间的相互协调
摘要: 把网站的搜索栏置于导航栏上,这种不怎么好的实现方式会让用户在查询上投入更多的精力。 我们有经常会谴责现在一种用像汉堡一样的菜单键来取代全局的导航栏,我们可以发现这反映了一种缺乏对chrome的简单化理念的理解,但人们会很合理地问这样一个问题,当我们有东西要搜索时为什么还要关注导航栏?现在搜索已经...
2014-09-24
干货 | SQL语句性能分析和优化
关系型数据库是做数据存储最重要的工具。无论是Oracale还是Mysql,都是需要通过SQL语句来和数据库进行交互的,这种交互我们通常称之为CRUD。在CRUD操作中,最最常用的也就是Read操作了。而对于不同的表结构,采用不同的SQL语句,性能上可能千差万别。本文,就基于MySql数据库,来介绍一下如何定位SQL语句的性能问题。
2021-03-31