向量数据库技术全景
本文深入探讨了向量数据库的基础概念、架构设计及实现技术,详细介绍了HNSW、FAISS和Milvus等关键算法和工具,旨在为高效管理和检索高维向量数据提供全面的技术指南。
为啥《阿里开发手册》一律禁止使用SELECT * ?
面试官:“小陈,说一下你常用的SQL优化方式吧。”陈小哈:“那很多啊,比如不要用SELECT *,查询效率低。巴拉巴拉...”面试官:“为什么不要用SELECT * ?它在哪些情况下效率低呢?”陈小哈:“SELECT * 它好像比写指定列名多一次全表查询吧,还多查了一些无用的字段。”面试官:“嗯...”陈小哈:“emmm~ 没了”陈小哈:“....??(...
ChatGPT取代搜索引擎?谷歌急了,百度不慌:早已布局
生成式AI要取代搜索引擎的声音,出现在ChatGPT发布的第一天。后来越传越邪乎,有人设想以后大家找资料都不说google一下了,而是geept一下。还有人说,搜索引擎给的一页10个蓝蓝的链接,以后就像老式拨号电话的转盘一样成为历史。谷歌刚开始还满不在乎,随着ChatGPT爆火出圈也感受到威胁,内部拉响红色警报,调整AI产品策...
2023-01-11
高性能MySQL实战(三):性能优化 | 京东物流技术团队
这篇主要介绍对慢 SQL 优化的一些手段,而在讲解具体的优化措施之前,我想先对 EXPLAIN 进行介绍,它是我们在分析查询时必要的操作,理解了它输出结果的内容更有利于我们优化 SQL。为了方便大家的阅读,在下文中规定类似 key1 的表示二级索引,key\_part1 表示联合索引的第一部分,unique\_key1 则表示唯一二级索引,pri...
2023-09-13
thinkphp6也可以像laravel/scout使用搜索引擎
目前,Scout 自带了一个 Elasticsearch 驱动;而编写自定义驱动程序很简单,你可以自由地使用自己的搜索实现来扩展 Scout。
2021-12-18
性能持续突破!火山引擎ByteHouse上线向量检索能力
随着LLM技术应用及落地,数据库需要提高向量分析以及AI支持能力,向量数据库及向量检索等能力“异军突起”,迎来业界持续不断关注。简单来说,向量检索技术以及向量数据库能为 LLM 提供外置的记忆单元,通过提供与问题及历史答案相关联的内容,协助 LLM 返回更准确的答案。
2024-01-10
第27期:索引设计(全文索引原理)
这条语句从表 fx 中检索字段 s1,过滤条件为 '%cluster%',这样的模糊查找语句性能很差,即使在字段 s1 上有索引也因无法找到切入点从而对表 fx 进行全表扫描,特别是对于一张大表,这类 SQL 的性能无疑致命。
2021-05-12
Linux命令必学:掌握grep让你成为文本搜索高手!
grep是Linux系统中一个非常强大且常用的命令,用于搜索文本中的指定模式。其名称来源于“global regular expression print”的缩写,它允许用户通过正则表达式或简单字符串来搜索文件中的内容。以下是grep命令的详细解释和一些具体的使用示例:
2024-06-06
专题实战 | 如何快速构建高质量电商行业搜索?
简介:本文详细介绍如何快速接入智能开放搜索(OpenSearch)电商行业增强版,助力企业实现高质量搜索效果,提升业务转化率及用户产品体验!
2022-01-17
MySQL索引深入理解底层数据结构
如果每次的数据都是以1,2,3,4,5,6的形式添加,会造成二叉树单边增长,从而导致查询效率依然低下红黑树会自己旋转,会有一个自平衡的过程,但是高度是不可控的,(height),如果是百万级别的数据,高度是完全不可控的
2019-06-08
集合 ArrayList 笔记
ArrayList在java util下,要导包ArrayList<E>是可调整大小的数组实现<E>是一种特殊的数据类型,泛型再出现<E>的地方我们使用引用数据类型替换即可,比如ArrayList<String>、ArrayList<Student>
2021-04-13
MongoDB中各种类型的索引
上篇文章中我们介绍了MongoDB中索引的简单操作,创建、查看、删除等基本操作,不过上文我们只介绍了一种类型的索引,本文我们来看看其他类型的索引。
2017-12-04
Pandas常用的两种数据类型之“Series”
1.安装与使用安装:pip install pandas根据惯例,我们使用如下的方式引入pandas:import pandas as pd两个常用数据类型:pandas提供两个常用的数据类型:• Series• DataFrame
2019-10-19
搞定万亿级MySQL海量存储的索引与分表设计实战
互联网业务往往使用MySQL数据库作为后台存储,存储引擎使用InnoDB。 我们针对互联网自身业务特点及MySQL数据库特性,讲述在具体业务场景中如何设计表和分表。 本文从介绍MySQL相关基础架构设计入手,并结合企业实际案例介绍分表和索引的设计实战技巧。
2021-01-25
MySQL 数据库设计总结
注意:MyISAM存储引擎 B-tree索引有一个很大的限制:参与一个索引的所有字段的长度之和不能超过1000字节。另外MyISAM数据和索引是分开,而InnoDB的数据存储是按聚簇(cluster)索引有序排列的,主键是默认的聚簇(cluster)索引,因此MyISAM虽然在一般情况下,查询性能比InnoDB高,但InnoDB的以主键为条件的查询性能是非常高...
[转]一张图彻底搞懂MySQL的 explain
转自 张德Talk[链接]explain关键字可以模拟MySQL优化器执行SQL语句,可以很好的分析SQL语句或表结构的性能瓶颈。 explain的用途 {代码...} explain的执行效果 {代码...} explain包含的字段 {代码...} 图片版 文字版 id字段 1. id相同 {代码...} 2. id不同 {代码...} 3. id相同又不同 {代码...} select_type字段 1. SIMPL...
2020-06-02
MySql 索引限制
Row size too large. The maximum row size for the used table type, not counting BLOBs, is 65535. This includes storage overhead, check the manual. You have to change some columns to TEXT or BLOBs
2023-03-04