找到约 10000 条结果
  • lucene使用
    一 概述   结构化数据    格式和长度固定,比如数据库表   非结构化数据  格式和长度不固定,比如word    全文检索      针对非结构化数据,采用先建立索引,然后再索引的基础上进行查询   java全文检索技术lucene  全文检索的工具包    应用场景:针对大数据量的情况下,对数据的模糊查询或者自然语言的检索。二 创建索...
    2020-02-13
  • elasticsearch笔记-003-文档API-CRUD-单文档索引操作
    [toc]单文档Index API1. 索引一个文档 {代码...} output: {代码...} 索引如果不存在, 会自动创建一个索引;如果不存在dynamic mapping, index时会创建一个;如果需要, 新的字段和对象会自动加入到mapping 定义中;2. 可选项op_type或_create(put_if_absent)put默认是覆盖的; 但是如果使用一个op_type选项, 可以改变这个逻辑...
    2020-11-26
  • MySQL函数索引及优化
    很多开发人员在使用MySQL时经常会在部分列上进行函数计算等,导致无法走索引,在数据量大的时候,查询效率低下。针对此种情况本文从MySQL5.7 及MySQL8.0中分别进行不同方式的优化。
    2020-09-18
  • Numpy数组的索引与切片和变形拼接分裂
    今天我们来讲一下Numpy数组的索引与切片,numpy数组的索引与切片和Python中的切片与索引的作用相同,可以快速的取出数据,进行下一步的运用或者查看,但是两种切片还有一些不同的地方。另外我们可以通过数组的变形拼接分裂快速的对数组进行做出改变,方便我们更快的对数组进行操作。
    2019-04-19
  • MySQL慢sql分析及优化
    注:由于在MySQL日常查询中,查询类型的语句占慢sql的大部分,因此本文仅针对query类型的sql进行阐述,modify类型会单独分析。
    2016-08-26
  • 一次非常有趣的 SQL 优化经历
    阅读本文大概需要 6 分钟。 前言 在网上刷到一篇数据库优化的文章,自己也来研究一波。 场景 数据库版本:5.7.25 ,运行在虚拟机中。 课程表 {代码...} 增加 100 条数据 {代码...} 运行耗时 {代码...} 课程数据 学生表 {代码...} 增加 7W 条数据 {代码...} 运行结果 {代码...} 学生数据 成绩表 {代码...} 增加 70W 条数...
    2019-03-26
  • ES数据扩容与索引设计
    第 1 种情况,需考虑增加分片的数量,减小单个分片的数据存储量。第 2 种情况,需要增加新节点,减小单节点上的数据量,缓解单节点数据容量吃紧的压力。当有新的节点加入集群,Elasticsearch 会自动移动分片,且在分片移动过程中,所有的索引搜索请求均在正常运行。
    2022-06-30
  • 个人博客 SEO 优化(1):搜索引擎原理介绍
    写在文章前面:前段时间接到一个 SEO 优化的私活。为了完成这个活,只能赶鸭子上架,从零开始系统地去学习 SEO 知识。经过几天的学习后,也算是入了门。才意识到 SEO 它的意义与重要性,觉得 SEO 对于做个人站点(博客也算是个人站点)的意义与重要性不言而喻。可能有人会反驳在如今自媒体、微信公众号及知乎、掘金、sf...
    2018-04-14
  • 电商搜索引擎的架构设计和性能优化
    「 OneAPM 技术公开课」由应用性能管理第一品牌 OneAPM 发起,内容面向 IT 开发和运维人员。云集技术牛人、知名架构师、实践专家共同探讨技术热点。本文系「OneAPM 技术公开课」第一期演讲嘉宾前当当网高级架构师吴英昊的演讲整理:
    2015-10-30
  • elasticsearch实现全文检索
    ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTfulweb接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。
    2017-06-26
  • Faiss优化:针对OMP_NUM_THREADS环境变量设置的测试验证
    前言 记录一下Faiss在项目使用中的一些优化,对OMP_NUM_THREADS 环境变量参数的测试验证~ {代码...} 结论: {代码...} 测试结果统计: * CPU=1 & OMP_NUM_THREADS=1 * CPU=3 & OMP_NUM_THREADS=1 * CPU=3 & OMP_NUM_THREADS=10 * CPU=1 & OMP_NUM_THREADS=10
    2018-12-21
  • 告别某度?一个开源无广告自托管的搜索引擎!
    Whoogle-search 是一个自托管、免广告的搜索引擎,它不存在 AMP 链、Cookie、IP 追踪等暴露个人隐私的问题。一键即可轻松部署为 Docker 应用程序,拉起来一个免 AD 的搜索服务,用来获取 Google 搜索结果。可作为台式机和移动设备上的主要搜索引擎替代品,快速而简单地实施。
    2021-09-23
  • MySQL学习笔记-9-order by
    1、初始化sort_buffer,确定放入name、city、age这三个字段;2、从索引city找到第一个满足city='杭州’条件的主键id,也就是图中的ID_X;3、到主键id索引取出整行,取name、city、age三个字段的值,存入sort_buffer中;4、从索引city取下一个记录的主键id;5、重复步骤3、4直到city的值不满足查询条件为止,对应的主键id...
    2022-01-30
  • 行云部署成长之路--慢SQL优化之旅 | 京东云技术团队
    当项目的SQL查询慢得像蜗牛爬行时,用户的耐心也在一点点被消耗,作为研发,我们可不想看到这样的事。这篇文章将结合行云部署项目的实践经验,带你走进SQL优化的奇妙世界,一起探索如何让那些龟速的查询飞起来!
    2024-01-08
  • Elasticsearch 8 RAG 技术分享
    本文由Elastic 中国区首席架构师 Jerry Zhu 在【AI搜索 TechDay】上的分享整理而成。【AI搜索 TechDay】 是 Elastic 和阿里云联合主办的 AI 技术Meetup系列,聚焦企业级 AI 搜索应用和开发者动手实践,旨在帮助开发者在大模型浪潮下升级 AI搜索,助力业务增长。
    2024-08-23
  • 学习JavaScript数据结构与算法 — 深度优先搜索算法
    上一次已经提到,图的遍历一般有两种算法,即广度优先和深度优先。其中深度优先搜索算法会从第一个指定的顶点开始遍历图,沿着路径直到这条路径最后一个顶点,接着原路回退并探索下一条路径。换句话说,它是先深度后广度地访问顶点,如下图1。
    2017-09-18
  • 优化搜索排序结果从而“ 提升CTR、CVR业务指标”
    简介: 搭建搜索功能不难,难的是如何提高搜索质量,帮助用户快速找到心中所想的内容或商品,那么搜索结果的相关性排序则是影响用户体验最关键的一环,本文通过阿里云开放搜索电商行业解决方案和大家聊一聊如何优化排序结果
    2020-08-27