找到约 10000 条结果
  • MySQL 中 SQL 优化常用的30 种方法,你会几种?
    3、应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描,如: select id from t where num is null 可以在num上设置默认值0,确保表中num列没有null值,然后这样查询: select id from t where num=0
    2020-07-22
  • Python网络爬虫入门:通⽤爬⾍和聚焦爬⾍
    网络爬虫也叫网络蜘蛛,如果把互联网比喻成一个蜘蛛网,那么蜘蛛就是在网上爬来爬去的蜘蛛,爬虫程序通过请求url地址,根据响应的内容进行解析采集数据, 比如:如果响应内容是html,分析dom结构,进行dom解析、或者正则匹配,如果响应内容是xml/json数据,就可以转数据对象,然后对数据进行解析。
    2020-08-13
  • Advanced RAG 01:讨论未经优化的 RAG 系统存在的问题与挑战
    编者按: 自 2023 年以来,RAG 已成为基于 LLM 的人工智能系统中应用最为广泛的架构之一。由于诸多产品的关键功能严重依赖RAG,优化其性能、提高检索效率和准确性迫在眉睫,成为当前 RAG 相关研究的核心问题。我们今天为大家带来的这篇文章指出,Naive RAG 在编制索引、检索和内容生成这三个核心步骤中都存在诸多问题:a...
    2024-04-03
  • MO_or关于SQL优化的感悟
    一、引言 {代码...} 强烈建议:由于本文篇幅较长,内容较多。推荐读者每次仅阅读一部分,请勿一次性读完(并不利于消化吸收,大佬除外)。 二、MySQL索引 2.1 索引的简单介绍 {代码...} 2.2 索引的数据结构 {代码...} 2.2.1 二叉树 {代码...} {代码...} {代码...} 2.2.2 红黑树(平衡二叉树) {代码...} {代码...} 2.2.3 B-T...
    2020-03-31
  • Elasticsearch 参考指南(删除映射类型)
    在Elasticsearch 7.0.0或更高版本中创建的索引不再接受_default_映射,索引在6.x中创建将继续在Elasticsearch 6.x中运行,类型在api 7.0中是不受支持的,它会中断对索引创建、put映射、get映射、put模板、get模板和get字段映射API的更改。
    2019-07-29
  • 基于代价的慢查询优化建议
    对于数据库来说,慢查询往往意味着风险。SQL执行得越慢,消耗的CPU资源或IO资源也会越大。大量的慢查询可直接引发业务故障,关注慢查询即是关注故障本身。本文主要介绍了美团如何利用数据库的代价优化器来优化慢查询,并给出索引建议,评估跟踪建议质量,运营治理慢查询。
    2022-04-26
  • MySQL的index merge(索引合并)导致数据库死锁分析与解决方案 | 京东云技术团队
    在DBS-集群列表-更多-连接查询-死锁中,看到9月22日有数据库死锁日志,后排查发现是因为mysql的优化-index merge(索引合并)导致数据库死锁。
    2023-10-13
  • 通义实验室新研究:大模型自己「扮演」搜索引擎,提升推理能力无需搜索API
    关注前沿科技 量子位强化学习(RL)+真实搜索引擎,可以有效提升大模型检索-推理能力。但问题来了:一方面,搜索引擎返回的文档质量难以预测,给训练过程带来了噪音和不稳定性。另一方面,RL训练需要频繁部署,会产生大量API开销,严重限制可扩展性。现在,来自阿里通义实验室的解决方案公开了:开源ZeroSearch,提供了...
    2025-05-17
  • mongoDB 基本使用
    mongoDB 基本使用进入mongodb {代码...} 查看所有数据库 {代码...} 查看当前处于哪个数据库的环境 {代码...} 切换/创建数据库 {代码...} 删除数据库 {代码...} 创建集合 {代码...} 查看当前数据库下的集合 {代码...} 删除集合 {代码...} 插入数据(没有对应的集合会直接生成集合) {代码...} 查看全部数据 {代码...} 查看...
    2021-09-01
  • 用Golang写一个搜索引擎 (0x00)--- 从零开始
    很早就想写一系列的这样的文章了,之前在一个电商公司做搜索,对搜索引擎有一些认识,来到一个新的创业公司以后非常高兴还有机会继续做这方面的事情,虽然领域已经变了,而且不是做搜索了,但是技术还是那些技术,并且有机会接触到了Go语言,对于一个将近10年C/C++的程序员来说,Go的一些特质让我觉得非常舒服,可参见我...
    2016-04-09
  • 【新功能】开放搜索多路召回技术解读
    简介:多路召回就是指采用不同的策略、特征或者简单模型,分别召回一部分候选集,然后再把这些候选集混合在一起后供后续排序模型使用的策略,本文将介绍开放搜索平台上的多路召回技术是如何深度提升搜索效果的~
    2021-08-27
  • Redis 向量搜索
    Redis 除了我们所熟知的缓存功能之外,还通过 RedisJSON、RediSearch、RedisTimeSeries、RedisBloom 等模块支持了 JSON 数据、查询与搜索(包括全文搜索、向量搜索、GEO 地理位置等)、时序数据、概率计算等等扩展功能。这些模块既可以按需导入,也被全部打包到了 Redis Stack 中方便我们直接使用。
    2024-07-09
  • SearchGPT 搜索引擎发布:让信息检索变得简单
    如今的互联网时代,我们每天都在与海量数据搏斗。无论是学习、工作还是生活,我们都需要快速准确地获取所需信息。然而,传统搜索引擎往往让人感到力不从心:关键词需要精准,结果泛滥成灾,有用信息如大海捞针。
    2024-07-26
  • 一个简单的Lucene工具类
    wsm-lucene 一个简单的Lucene工具类,通过注释的方式来配置构建索引的字段。提供新建索引、查找、删除、更新方法,支持分页。代码地址:[链接] 所需jar包 lucene-core:2.4.0 lucene-analyzers:2.4.1 commons-logging:1.2 背景 以前在做某个feature的时候,鉴于存储在DB中的数据量过大,故使用Lucene来优化查找性能。相信...
    2017-11-23
  • 基于文本图形(ncurses)的文本搜索工具 ncgrep
    源码下载 [链接] 背景 作为一个VIM党,日常工作开发中,会经常利用grep进行关键词搜索,以快速定位到文件。如图: 利用grep进行文本搜索 但是,这一过程会有两个效率问题: 展示的结果无法进行直接交互,需要手动粘贴文件路径在打开 展示的结果没有进行分组,直接将结果罗列出来 可想而知,当搜索的内容结果集比较大时,...
    2017-12-12
  • 使用Electron制作一个快速搜索应用(入门向)
    Electron是由Github开发,用HTML,CSS和JavaScript来构建跨平台桌面应用程序的一个开源库。 Electron通过将Chromium和Node.js合并到同一个运行时环境中,并将其打包为Mac,Windows和Linux系统下的应用来实现这一目的。
    2018-11-26
    1
  • 系列教程 | 用Jina搭建PDF搜索引擎Part 3
    前两篇文章讲解了PDF搜索的操作方法,本期推送将讲解构建PDF搜索引擎的经验和教训。之前我们以一个案例为代表讲述的PDF搜索引擎的构建,并不能包揽全部PDF搜索的种类和情况。我们的初始版本如下:[链接]它旨在:01具有通用性,并能很好地处理任何类型的PDF数据(强调工作良好 - 仅仅返回结果并不意味着它是好的 - 它需要...
    2022-06-08