SpringBoot与检索 ElasticSearch
我们的应用经常需要添加检索功能,开源的ElasticSearch是目前全文搜索引|擎的首选。他可以快速的存储、搜索和分析海量数据。Spring Boot通过整合SpringData ElasticSearch为我们提供了非常便捷的检索功能支持;Elasticsearch是一个分布式搜索服务,提供Restful API,底层基于Lucene,采用多shard (分片)的方式保证数据安全,...
2020-04-16
【前端芝士树】SPA 网站 SEO 初级优化指南(MVVM)
百度搜索资源平台 [链接] 链接提交地址 [链接] 百度爬虫 UA Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0; +[链接] Mozilla/5.0 (compatible; Baiduspider/2.0; +[链接])
es 在数十亿级别数量下如何提高查询效率?
这个问题是肯定要问的,说白了,就是看你有没有实际干过 es,因为啥?其实 es 性能并没有你想象中那么好的。很多时候数据量大了,特别是有几亿条数据的时候,可能你会懵逼的发现,跑个搜索怎么一下 5~10s,坑爹了。第一次搜索的时候,是 5~10s,后面反而就快了,可能就几百毫秒。
iframe有那些优缺点?
iframe的优点: iframe能够原封不动地把嵌入的网页展现出来。 如果有多个网页引用iframe,那么你只需要修改iframe的内容,就可以实现调用的每一个页面内容的更改,方便快捷。 网页如果为了统一风格,头部和版本都是一样的,就可以写成一个页面,用iframe来嵌套,可以增加代码的可重用。 如果遇到加载缓慢的第三方内容如...
1W2000字 一文读懂向量数据库:原理、索引技术与选型指南
本文1W2000字,本文简要介绍了向量数据库,重点阐述了其在检索增强生成(RAG)应用中的关键作用。文章突出了ChromaDB、Pinecone和Weaviate等热门数据库,强调了高效存储和检索对优化 RAG 性能的重要性。文中深入探讨了各种索引技术和算法,对Annoy、倒排文件(IVF)索引、随机投影、乘积量化、局部敏感哈希(LSH)、HNSW...
Elasticsearch系列---初识Elasticsearch
Elasticsearch简称ES,是一个基于Lucene构建的开源、分布式、Restful接口的全文搜索引擎,还是一个分布式文档数据库。天生就是分布式、高可用、可扩展的,可以在很短的时间内存储、搜索和分析大量的数据。
百度AI搜索V2接口:支持DeepSeek+多模态检索,完备度业界领先!千帆AppBuilder再升级
进一步降低开发门槛,落地大模型到应用的最后一公里。在千帆 AppBuilder 最新升级的 V1.4 版本中,我们全面接入DeepSeek,赋能DeepSeek应用开发。
2025-03-14
提高营销型网站信用度的方法
对于一个刚上线的营销型网站来说权重都是为0的,权重低的网站不管是在交换友链的时候还是在优化网站的关键词的时候都是区别的,那什么时候网站权重呢,我们可以简单的理解为是搜索引擎对网站权威性的认可程度,也是对这个网站整体的一个评估,网站权重的高低将决定着在其搜索引擎心目中的份量,排名也就越好,所以说权重...
2021-01-28
解决Laravel5.1中如何配置QQ发送邮件
在使用Laravel5的Auth:ResetsPasswords找回密码功能时报错如下: {代码...} 后来发现是配置原因,因为使用的是QQ邮箱,需要在QQ邮箱中配置开启smtp设置 1.在QQ邮箱中[设置]->[账户] 中打开POP3/SMTP服务 2.Laravel中修改.env文件 配置mail信息 3.在/config/mail.php中配置邮件发送人名称和地址 4.然后尝试点下密码重...
2016-04-13
ChatGPT 支持的搜索引擎 Bing 究竟什么样?
微软于2月8日北京时间凌晨在 Redmond 线下举办一场媒体活动,围绕微软的产品以及 AI,公布最新消息。这里我们先回顾一下微软在 AI 上的布局。
数据库索引的知识点,你所需要了解的都在这儿了
索引是对数据库表中一列或多列的值进行排序的一种结构,使用索引可快速访问数据库表中的特定信息。作为辅助查询的工具,合理的设计索引能很大程度上减轻db的查询压力,db我们都知道,是项目最核心也是最薄弱的地方,如果压力太大很容易产生故障,造成难以预计的影响。所以,不管是日常开发还是面试,索引这一块知识体系...
es 的分布式架构原理是什么?
在搜索这块,lucene 是最流行的搜索库。几年前业内一般都问,你了解 lucene 吗?你知道倒排索引的原理吗?现在早已经 out 了,因为现在很多项目都是直接用基于 lucene 的分布式搜索引擎—— ElasticSearch,简称为 es。
2020-05-17
终于卷完了! ElasticSearch 打怪升级进阶成神之路( 2023最新版 )
在当今这样的就业大背景下,卷是肯定的,强大自己也是必须的。所以,学习不能停,必须一直卷下去。所以,从今天开始,让我们一起卷下一个知识体系的学习之旅:搜索引擎 ElasticSearch 。希望大家能够从中收获多多!如有帮助,请点在看、转发支持一波!!!
Milvus v0.7.1 发布:多并发下的性能大幅提升!
针对 FLAT 索引类型,新增子结构(substructure)和超结构(superstructure)距离计算方式。这两种距离计算方式常用于化学分子式的子结构和超结构搜索。[链接]
2020-04-11
【Elasticsearch 技术分享】—— Elasticsearch ?倒排索引?这都是什么?
前言革命同志是块砖,哪里需要哪里搬!这不,老大发话,要我在组内做一个 Elasticsearch 技术分享。这不话题一转,开始看起来 ES 了。虽然很久之前用过 ELK 做过日志监控系统,但是毕竟时隔已久,还是得从头看起。当然手头的活也不能停,话不多说,开始分享。先看看什么是 ES?
2020-11-07
科普一下Elasticsearch中BM25算法的使用
首先还是先了解几个概念,Elasticsearch是一个开源的分布式搜索和分析引擎,它使用一系列算法来计算文档的相关性分数(relevance score)。这些算法用于确定查询与文档的匹配程度,以便按相关性对搜索结果进行排序。以下是Elasticsearch中常用的算分算法:
2023-07-16
聊聊日志硬扫描,阿里 Log Scan 的设计与实践
简介: SLS 新推出 Scan 功能,让未索引的字段也支持搜索(硬扫描模式),节省全量索引产生的构建和存储费用,同时 Scan 的运行时计算模式对于杂乱结构的日志数据有更好的适配,帮助企业客户实现数字化增效、IT 支出降本的目标。日志 Scan 的发展与背景大数据快速增长的需要泛日志(Log/Trace/Metric)是大数据的重要组...
2022-11-07