正则一文通
0x000 概述 正则是用来搜索字符串的!!!正则是用来搜索字符串的!!!正则是用来搜索字符串的!!! 重要的事儿说三遍,这个是这片文章的结论。 0x001 环境介绍 主要示例语言:javascript 实验场地:Chrome Console 主要函数:str.match(regexp) 示例: 参数:regexp一个正则表达式对象。如果传入一个非正则表达式对象...
SQL优化——隐式字符编码转换
假设tradeid字段有索引,且为varchar类型:mysql> select * from tradelog where tradeid=110717;等价于:mysql> select * from tradelog where CAST(tradid AS signed int) = 110717;
2022-02-24
Elasticsearch入门一
一、认识ES二、ES功能分布式、搜索(全文检索、结构化检索)、数据分析三、lucene和ES的前世今生lucene是最先进、功能最强大的搜索库,直接基于lucene开发,非常的复杂。elasticsearch,基于lucene,隐藏复杂性,提供简单易用的api接口。四、ES的核心概念Near Realtime(NRT):近实时,从写入数据到数据可以被搜索到有一个小延...
2021-03-28
ChatGPT 支持的搜索引擎 Bing 究竟什么样?
微软于2月8日北京时间凌晨在 Redmond 线下举办一场媒体活动,围绕微软的产品以及 AI,公布最新消息。这里我们先回顾一下微软在 AI 上的布局。
聊聊日志硬扫描,阿里 Log Scan 的设计与实践
简介: SLS 新推出 Scan 功能,让未索引的字段也支持搜索(硬扫描模式),节省全量索引产生的构建和存储费用,同时 Scan 的运行时计算模式对于杂乱结构的日志数据有更好的适配,帮助企业客户实现数字化增效、IT 支出降本的目标。日志 Scan 的发展与背景大数据快速增长的需要泛日志(Log/Trace/Metric)是大数据的重要组...
2022-11-07
科普一下Elasticsearch中BM25算法的使用
首先还是先了解几个概念,Elasticsearch是一个开源的分布式搜索和分析引擎,它使用一系列算法来计算文档的相关性分数(relevance score)。这些算法用于确定查询与文档的匹配程度,以便按相关性对搜索结果进行排序。以下是Elasticsearch中常用的算分算法:
2023-07-16
INFINI Labs 产品更新 | Easysearch 新增快照搜索功能,Console 支持 OpenSearch 存储
INFINI Labs 产品又更新啦~,包括 Easysearch v1.7.0、Console v1.13.0。本次各产品更新了 Easysearch 快照搜索功能;Console 支持 OpenSearch 集群存储系统数据、优化了初始化安装向导流程等。
2023-12-16
恶意爬虫防护 | 京东云技术团队
如果您仔细分析过任何一个网站的请求日志,您肯定会发现一些可疑的流量,那可能就是爬虫流量。根据Imperva发布的《2023 Imperva Bad Bot Report》在2022年的所有互联网流量中,47.4%是爬虫流量。与2021年的42.3%相比,增长了5.1%。在这些爬虫流量中,30.2%是恶意爬虫,比2021年的27.7%增长了2.5%。
2023-09-06
使用 chatGPT 高效学习的套路
我作为一个大部分知识都是从搜索引擎和 GitHub 学来的程序员,第一次和 chatGPT 促膝长谈后,基本认定了一个事实:chatGPT 一定能大幅增加程序员学习新技术的效率。
2023-03-04
达摩院自研向量检索引擎Proxima在行业搜索中的应用
简介:淘宝搜索推荐、视频搜索背后使用了什么样的检索技术?非结构化数据检索,向量检索,以及多模态检索,它们到底解决了什么问题?今天由阿里达摩院的科学家从业务问题出发,抽丝剥茧,深度揭秘达摩院内部技术,向量检索引擎 Proxima,以及在阿里云开放搜索产品行业模板能力的实践应用~
2021-05-20
GBASE 8s 全文索引
BTS提供全文本搜索能力,可以检索一个表上的字符数据类型列(BLOB, CHAR, CLOB, LVARCHAR, NCHAR, NVARCHAR, or VARCHAR)数据
2024-09-12
购物网站建设如何做好优化工作
相信所有的购物类网站都会有类似于,产品销售排行、热门推荐、历史浏览等排行榜性质的栏目,这个地方其实也是大家最容易忽视的地方。一般我们的产品页除了做内容调整,都不会做更新,这就造成这些页面对于搜索引擎来说是“不活跃”、“无更新”的,搜录和快照都是很老的。我们要怎么来改变这个问题呢?用好了排行榜就可以让这...
2019-09-06
golang如何发送邮件(qq邮箱)
golang发送邮件的功能,我们今天介绍golang发送qq邮件,相信大家都有qq邮箱吧,操作起来比较便捷,使用golang发送邮件更是简单,相信大家看完都能上手操作并学会。
「首届搜索技术创新挑战赛 STI」圆满落幕!超1600 名选手参赛,推动搜索领域再进化
12月28日,以「新智能·新搜索」为主题的首届百度搜索技术创新挑战赛(STI)在京圆满落幕。本次赛事由百度搜索携手NVIDIA联合发起,北京大学、山东大学、湖南人工智能学会、西安电子科技大学等各地高校学会共同举办。赛程共历时 2个月,超 1600名参赛选手报名参加,覆盖 33个省市及海外城市。
泛圈企业云盘给管理咨询公司更好的办公环境
管理咨询公司在服务客户过程中会产生大量资料,而这些资料要好好的保存。不然弄丢或者损坏等问题而造成资料用不了,这将是企业的一笔巨大的损失,所以需要集中存储和安全管控。目前中心化存储云盘文件被泄露的事件不断出现,给企业造成以下问题:查找效率低
2020-05-22
Elasticsearch 向量搜索
Elasticsearch 向量搜索本文将会介绍 Elasticsearch 向量搜索的两种方式。向量搜索提到向量搜索,我想你一定想知道:向量搜索是什么?向量搜索的应用场景有哪些?向量搜索与全文搜索有何不同?ES 的全文搜索简而言之就是将文本进行分词,然后基于词通过 BM25 算法计算相关性得分,从而找到与搜索语句相似的文本,其本质...
Elasticsearch与MySQL的概念对比
我们统一的把mysql与elasticsearch的概念做一下对比:MySQLElasticsearch说明TableIndex索引(index),就是文档的集合,类似数据库的表(table)RowDocument文档(Document),就是一条条的数据,类似数据库中的行(Row),文档都是JSON格式ColumnFiled字段(Field),就是JSON文档中的字段,类似数据库中的列(Column)SchemaMappi...
2024-10-16