信息检索课程实验笔记
注:前端不相关---只是用node实现了一下如何爬网站数据(大学课程的实验) 网页索引与检索 实验目的 l 了解搜索引擎的工作原理及实现方法;l 熟悉倒排索引的创建;l 掌握查询处理技术。 实验要求 l 独立或合作(1~2人)完成实验内容;l 独立完成实验报告;(简单要求如下)1) 实验目的、内容与要求及实验环境描述;2) ...
2019-06-06
vscode转大写
1.输入Ctrl+P调出搜索框(Mac电脑command+p)2.在搜索框中输入>符号下面就会出现转大写3.转大写之前选中高亮所需要的字母
搜索引擎ElasticSearch入门
想查数据就免不了搜索,搜索就离不开搜索引擎,百度、谷歌都是一个非常庞大复杂的搜索引擎,他们几乎索引了互联网上开放的所有网页和数据。然而对于我们自己的业务数据来说,肯定就没必要用这么复杂的技术了,如果我们想实现自己的搜索引擎,方便存储和检索,可以快速地储存、搜索和分析海量数据。搜索引擎有很多种,我...
elasticsearch实现全文检索
ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTfulweb接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。
Faiss优化:针对OMP_NUM_THREADS环境变量设置的测试验证
前言 记录一下Faiss在项目使用中的一些优化,对OMP_NUM_THREADS 环境变量参数的测试验证~ {代码...} 结论: {代码...} 测试结果统计: * CPU=1 & OMP_NUM_THREADS=1 * CPU=3 & OMP_NUM_THREADS=1 * CPU=3 & OMP_NUM_THREADS=10 * CPU=1 & OMP_NUM_THREADS=10
2018-12-21
Numpy数组的索引与切片和变形拼接分裂
今天我们来讲一下Numpy数组的索引与切片,numpy数组的索引与切片和Python中的切片与索引的作用相同,可以快速的取出数据,进行下一步的运用或者查看,但是两种切片还有一些不同的地方。另外我们可以通过数组的变形拼接分裂快速的对数组进行做出改变,方便我们更快的对数组进行操作。
2019-04-19
lucene使用
一 概述 结构化数据 格式和长度固定,比如数据库表 非结构化数据 格式和长度不固定,比如word 全文检索 针对非结构化数据,采用先建立索引,然后再索引的基础上进行查询 java全文检索技术lucene 全文检索的工具包 应用场景:针对大数据量的情况下,对数据的模糊查询或者自然语言的检索。二 创建索...
2020-02-13
elasticsearch笔记-003-文档API-CRUD-单文档索引操作
[toc]单文档Index API1. 索引一个文档 {代码...} output: {代码...} 索引如果不存在, 会自动创建一个索引;如果不存在dynamic mapping, index时会创建一个;如果需要, 新的字段和对象会自动加入到mapping 定义中;2. 可选项op_type或_create(put_if_absent)put默认是覆盖的; 但是如果使用一个op_type选项, 可以改变这个逻辑...
2020-11-26
MySQL函数索引及优化
很多开发人员在使用MySQL时经常会在部分列上进行函数计算等,导致无法走索引,在数据量大的时候,查询效率低下。针对此种情况本文从MySQL5.7 及MySQL8.0中分别进行不同方式的优化。
2020-09-18
MySQL慢sql分析及优化
注:由于在MySQL日常查询中,查询类型的语句占慢sql的大部分,因此本文仅针对query类型的sql进行阐述,modify类型会单独分析。
一次非常有趣的 SQL 优化经历
阅读本文大概需要 6 分钟。 前言 在网上刷到一篇数据库优化的文章,自己也来研究一波。 场景 数据库版本:5.7.25 ,运行在虚拟机中。 课程表 {代码...} 增加 100 条数据 {代码...} 运行耗时 {代码...} 课程数据 学生表 {代码...} 增加 7W 条数据 {代码...} 运行结果 {代码...} 学生数据 成绩表 {代码...} 增加 70W 条数...
2019-03-26
ES数据扩容与索引设计
第 1 种情况,需考虑增加分片的数量,减小单个分片的数据存储量。第 2 种情况,需要增加新节点,减小单节点上的数据量,缓解单节点数据容量吃紧的压力。当有新的节点加入集群,Elasticsearch 会自动移动分片,且在分片移动过程中,所有的索引搜索请求均在正常运行。
2022-06-30
个人博客 SEO 优化(1):搜索引擎原理介绍
写在文章前面:前段时间接到一个 SEO 优化的私活。为了完成这个活,只能赶鸭子上架,从零开始系统地去学习 SEO 知识。经过几天的学习后,也算是入了门。才意识到 SEO 它的意义与重要性,觉得 SEO 对于做个人站点(博客也算是个人站点)的意义与重要性不言而喻。可能有人会反驳在如今自媒体、微信公众号及知乎、掘金、sf...
电商搜索引擎的架构设计和性能优化
「 OneAPM 技术公开课」由应用性能管理第一品牌 OneAPM 发起,内容面向 IT 开发和运维人员。云集技术牛人、知名架构师、实践专家共同探讨技术热点。本文系「OneAPM 技术公开课」第一期演讲嘉宾前当当网高级架构师吴英昊的演讲整理:
学习JavaScript数据结构与算法 — 深度优先搜索算法
上一次已经提到,图的遍历一般有两种算法,即广度优先和深度优先。其中深度优先搜索算法会从第一个指定的顶点开始遍历图,沿着路径直到这条路径最后一个顶点,接着原路回退并探索下一条路径。换句话说,它是先深度后广度地访问顶点,如下图1。
优化搜索排序结果从而“ 提升CTR、CVR业务指标”
简介: 搭建搜索功能不难,难的是如何提高搜索质量,帮助用户快速找到心中所想的内容或商品,那么搜索结果的相关性排序则是影响用户体验最关键的一环,本文通过阿里云开放搜索电商行业解决方案和大家聊一聊如何优化排序结果
【新功能】开放搜索多路召回技术解读
简介:多路召回就是指采用不同的策略、特征或者简单模型,分别召回一部分候选集,然后再把这些候选集混合在一起后供后续排序模型使用的策略,本文将介绍开放搜索平台上的多路召回技术是如何深度提升搜索效果的。
2021-12-27