京东面试题:ElasticSearch深度分页解决方案
大家好,我是不才陈某~Elasticsearch 是一个实时的分布式搜索与分析引擎,在使用过程中,有一些典型的使用场景,比如分页、遍历等。在使用关系型数据库中,我们被告知要注意甚至被明确禁止使用深度分页,同理,在 Elasticsearch 中,也应该尽量避免使用深度分页。这篇文章主要介绍 Elasticsearch 中分页相关内容!关注公...
deepin15官方源更细特别慢,换阿里云的记录
deepin15.4安装,总是没有引导。但是15.3没问题。所以自己是先装15.3然后在升级的但是一个多G的更新。下载及其缓慢。设置里可以配置软件源。但是没有改善。搜索问题后,发现有人提到,其实改了设置里的,没有生效。自己编辑/etc/apt/source.list文件,发现确实没有改变而阿里云的速度一般不错,就去找阿里云开源镜像站根...
2020-11-19
鄂维南李航领衔造高级论文搜索Agent,召回率和精准性超谷歌学术等,磕盐党狂喜
中科院院士鄂维南、字节AI实验室总监李航领衔,推出高级论文搜索Agent。名为PaSa,两个Agent分别执行多轮搜索和判断论文是否满足查询要求的任务,模仿人类复杂学术搜索行为。现在就有Demo可玩。只需提供研究主题或描述想法,它就会迅速展开搜索并按相关度自动排列组织顺序。点击标题卡,不用跳转页面,就能显示论文作者...
2025-01-26
Ajax异步自动填充
在开发中,通常情况下,搜索功能是非常常见的,类似京东,当我们输入搜索条件时,将自动填充我们需要的数据,并提供选择,我们将此类功能称为:自动填充(autocomplete)。如图1所示:
2019-12-25
浏览器中显示“您与此网站之间建立的连接不安全”
有人多问我,自己的网站在浏览器打开后会显示一个“不安全”的标识,这让很多用户以为是钓鱼网站。不同的浏览器会显示不同的标识,但这些标识都是代表一个意思,那就是该网站不安全,鼠标移上去会显示“您与此网站之间建立的连接不安全”,如下图所示:
2020-11-21
Elasticsearch与MySQL的概念对比
我们统一的把mysql与elasticsearch的概念做一下对比:MySQLElasticsearch说明TableIndex索引(index),就是文档的集合,类似数据库的表(table)RowDocument文档(Document),就是一条条的数据,类似数据库中的行(Row),文档都是JSON格式ColumnFiled字段(Field),就是JSON文档中的字段,类似数据库中的列(Column)SchemaMappi...
2024-10-16
个人博客 SEO 优化(1):搜索引擎原理介绍
写在文章前面:前段时间接到一个 SEO 优化的私活。为了完成这个活,只能赶鸭子上架,从零开始系统地去学习 SEO 知识。经过几天的学习后,也算是入了门。才意识到 SEO 它的意义与重要性,觉得 SEO 对于做个人站点(博客也算是个人站点)的意义与重要性不言而喻。可能有人会反驳在如今自媒体、微信公众号及知乎、掘金、sf...
学习 HTTP Referer
背景HTTP 中 Referer 字段在工作中或许并不会吸引你的注意,隐藏在 Network 的请求之下,但是却有着非常重要的作用。平常你一定会遇到一些问题需要去排查,假如这个问题在你排查完全部代码后,依然没有解决,这个时候你会怎么办?此时我们就需要将排查问题的角度转换一下,切换到 HTTP 协议上。最近工作当中也碰到了与此...
2022-08-10
npm命令记录
模块包操作a、本地安装(install可缩写i): {代码...} b、全局安装: {代码...} c、安装指定版本: {代码...} d、安装到开发环境(简写-D): {代码...} e、安装到生成环境(简写-S): {代码...} f、卸载模块: {代码...} g、更新模块: {代码...} h、查看模块信息: {代码...} i、查询模块地址: {代码...} j、搜索模块:...
2022-01-12
JavaScript 常用函数
计算平均数 {代码...} 将RGB转为十六进制 {代码...} 计算两个日期相差的天数 {代码...} 华氏度/摄氏度相互转换 {代码...} 查询某个日期是否为工作日 {代码...} 获取选定的文本 {代码...} 文字复制到剪贴板 {代码...} 检查设备类型 {代码...} 检查浏览器当前选项卡是否在后台 {代码...} 生成随机十六进制颜色值 {代码...}...
2023-05-03
记一次生产慢sql索引优化及思考 | 京东云技术团队
看了一下,还好不是很频繁,内心会更加从容排查问题,应该是特定条件下没有走到索引导致,如果频繁出现慢查询,可能会将数据库连接池打满,导致数据库不可用,从而导致应用不可用。
2023-12-18
AI 原生数据库 Infinity 正式开源
经过长时间紧锣密鼓的开发,AI 原生数据库 Infinity 已于2023年12月21日正式开源了。AI 原生数据库,定义为专门服务大模型的数据库,其具体场景即为 RAG(Retrieval Augmented Generation)。未来企业大模型应用架构的基础设施层面,将只需要一个 AI 原生数据库配合一个大模型(当下是 LLM 大语言模型,未来还会有多模态...
App服务化, 10倍增长,你想知道的都在这里了!
Apple为iOS 9发布了一个所谓的通用链接的深层链接特性,即Universal links。虽然它并不完美,但是这一发布,让数以千计的应用开发人员突然意识到自己的应用体验被打破。魔窗推出了mLink ,为了打破App孤岛格局,构建情景式的服务链,大幅提升用户体验,让每一次的连接都产生价值。
2016-03-24
Elasticsearch 向量搜索
Elasticsearch 向量搜索本文将会介绍 Elasticsearch 向量搜索的两种方式。向量搜索提到向量搜索,我想你一定想知道:向量搜索是什么?向量搜索的应用场景有哪些?向量搜索与全文搜索有何不同?ES 的全文搜索简而言之就是将文本进行分词,然后基于词通过 BM25 算法计算相关性得分,从而找到与搜索语句相似的文本,其本质...
pgvector: 30 倍构建向量嵌入索引
Postgres 最受欢迎的向量搜索扩展 pgvector 最近实现了并行索引构建功能,这将分层可导航小世界 (HNSW) 索引构建时间显著提高了 30 倍。
2024-08-01
大规模相似性搜索:原理、技术与 Faiss 实践
人工智能和机器学习的兴起,催生了大量高维数据表示形式,即嵌入(embeddings),它们捕捉数据点之间的复杂关系,助力强大的分析与理解。然而,在大型数据集中查找相似嵌入是一项计算密集型任务。相似性搜索在检索增强生成(Retrieval-Augmented Generation,RAG)领域引发了变革。RAG 将传统信息检索与语言模型相结合,...
2025-01-06
阿里云OpenSearch重磅推出LLM问答式搜索产品,助力企业高效构建对话式搜索服务
以通义千问为代表的生成大模型正在引领搜索技术变革,其表现出的“什么都懂,什么都能聊”关键是依赖于底座大语言模型(Large Language Model, LLM)中压缩的世界知识。但无论是多强大的LLM,能压缩的知识量仍然是有限的。
2023-06-06