主要观点:3 天前 antirez 的 7066 次浏览,昨日将向量集合并到 Redis 中,介绍了相关 README 及新数据结构目标和背景等。
关键信息:
- 向量集是 Redis 核心的一部分,类似集合的数据类型,有向量作为分数,可按 Redis 方式添加和删除元素等。
- 实现基于“模块”,保留模块 API 以促进内部模块化,从 Redis 8 开始每个实例都有向量集。
- 最新大数据结构是 Streams,引入新数据类型负担在 antirez 身上,他认为向量相似性概念简单应设计简单 API。
- 实现向量相似性重写 HNSWs,解决 true deletions 和保留 HNSW 图的连接性等问题,与其他实现有差异。
- 支持向量相似性请求的线程化,可拆分读写,支持量化(默认 8 位量化)和随机投影。
- 向量集在磁盘上序列化为图,加载快,可组合成不同模式处理多向量。
- 介绍了 VGETATTR 和 VSETATTR 用于关联字符串,可通过过滤表达式进行筛选。
重要细节: - https://github.com/redis/redis/blob/unstable/modules/vector-sets/README.md 可查看详细信息。
- 以具体例子说明在不同机器上向量集的性能,如 300 组件 300 万项向量集每秒可进行 50/60k VSIM 操作。
- 详细阐述了向量集的各种特性和用法,如多个小向量集可合并查询等,文档后续会扩展。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。