深入搜索引擎原理
之前几段工作经历都与搜索有关,现在也有业务在用搜索,对搜索引擎做一个原理性的分享,包括搜索的一系列核心数据结构和算法,尽量覆盖搜索引擎的核心原理,但不涉及数据挖掘、NLP等。文章有点长,多多指点~~
自动网络搜索(NAS)在语义分割上的应用(一)
多数神经网络结构都是基于一些成熟的backbone,如ResNet, MobileNet,稍作改进构建而成来完成不同任务。正因如此,深度神经网络总被诟病为black-box,因为hyparameter是基于实验求得而并非通过严谨的数学推导。所以,很多DNN研究人员将大量时间花在修改模型和实验“调参”上面,而忽略novelty本身。许多教授戏称这种现象为...
2020-06-10
大众点评内容搜索算法优化的探索与实践
本文整理自美团技术沙龙第80期《美团内容智能分发的算法实践》,分享内容主要包括三部分。第一部分介绍了大众点评内容搜索的场景特点以及面临的挑战;第二部分介绍了为应对这些困难和挑战,技术团队在链路各环节上做的实践优化,包括内容消费和搜索满意度的优化等等;第三部分是总结和对未来的展望。
2024-03-22
集成开发环境(IDE)热度排行榜_2019.09
通过分析在 Google 上搜索 IDE 的下载页面的频率,创建 Top IDE Index。搜索 IDE 越多,IDE 就越流行。原始数据来自 Google 趋势(Google Trends)。
2019-09-05
学完14个实例掌握 grep 命令的使用方法
Grep是Linux/Unix系统中的一个命令行工具,用于从文件中搜索文本或字符串。Grep代表全局正则表达式打印。当我们使用指定字符串运行grep命令时,如果匹配,则它将显示包含该字符串的所在行,而不修改现有文件的内容。
2022-08-31
反爬虫的重点:识别爬虫
我们在网站运营的时候,最大的问题就是:我们自己花费几个小时甚至是几天辛辛苦苦创作作的内容,被爬虫只需要 1s 就抓去了。为了保卫我们创作的成果,也为了网站的稳定运行,我们需要对爬虫说:No,我们在反爬虫的过程中最重要的就是如何识别爬虫。
2022-07-05
一种基于图片搜索视频的方案
作者:京东零售 谷伟1.商品搜索1.1网络购物的搜索手段随着移动互联网发展,手机端购物已成为人们生活的常态。人们在搜索商品时采用的手段也越来越丰富,当前的主要搜索方式是文本搜索与拍照搜索。1.2文本搜索文本搜索应用比较广泛,较为常用的是关键字匹配,针对商品信息的相关描述进行分词,并对分词建立索引库,从而达...
2023-02-02
页面缓存的操作(搜索历史记录),页面搜索功能实现
进入搜索后判断缓存中是否有值,如果没有缓存,隐藏历史记录跟小图标,如果有缓存,加载缓存,将缓存的内容加载进预先制作的显示容器中,并且在上方显示历史记录跟小图标;
ElasticSearch架构介绍及原理解析
在当今大数据时代,数据的快速增长使得有效地管理、检索和分析数据成为企业发展的关键。Elasticsearch(以下简称ES)作为一种开源的分布式搜索和分析引擎,在这个领域中扮演着重要的角色。它不仅仅只是全文搜索,还支持结构化搜索、数据分析、复杂的语言处理、地理位置和对象间关联关系等。
2024-03-11
阿里云 AI 搜索方案解读:大模型驱动下的智能搜索,助力企业数字化转型
在过去的一年里面,随着大模型的技术突飞猛进,大模型的能力日益增强。这些都驱动着我们的搜索技术快速的演进到了下一代,也就是 AI 搜索的技术。大模型的快速发展不仅重塑了搜索技术的基础,也为各行各业的数字化转型提供了强有力的支持。
2025-01-08
vscode集成git bash 后解决中文乱码问题
{代码...} 该办法为参考网上的内容进行的修改版 1.git目录下搜索gitconfig文件中增加以下内容: {代码...} 2.git目录下搜索git-completion.bash文件中增加以下内容: {代码...} 3.git目录下搜索inputrc文件中增加以下内容: {代码...} 2017年2月9日更新 最新版本的vscode1.9已经不须要做以上修改就能正常显示中文
2017-01-24
vitepress模糊搜索配置
在docs\.vitepress\config.mts文件中进行配置themeConfig配置项中添加search:provider: "local"即可开启全局模糊搜索,搜索本地文档数据
2025-03-03
轻量级rpc框架
rpc框架需要思考什么 如何与spring集成? 为什么要使用spi机制 服务发现和注册是如何做的,如何做到高可用。 服务的负载均衡如何做 动态代理怎么实现 心跳检测怎么做的 通信用什么框架做比较合适 消息如何编码和解码
2019-08-26
DataX系列
此外,还有通道(并发)、记录流、字节流三种流控模式是怎么控制的,数据怎么转换的,任务失败重试是怎么做的,详细的日志是怎么打印的等等,这里就不继续了。
2021-11-30
【谁说程序员不浪漫】使用node每天定时给女友发送浪漫邮件
先看效果 其中的内容包含了当前时间、与女友的纪念日、当天天气、每日一句话和生活小常识(爱从小事做起) 所用到的包 "cheerio": "^1.0.0-rc.3", //爬取网站内容 "node-schedule": "^1.3.2", //定时器 "nodemailer": "^6.3.1", //发送邮箱 "nodemailer-smtp-transport": "^2.7....
基础篇:项目前期准备以及初始化
这里就不详细展开注册步骤了,很简单的,根据提示操作就行,3分钟就能注册好一个小程序账号。注意:建议使用全新的邮箱,没有注册过其他小程序或者公众号的邮箱。没有邮箱的话,先注册邮箱再回来注册小程序账号。
2023-04-20
Github Page 搜索工具更新 -- 索引数量扩容
目前Github Page可以索引到的数量是两万多条(26863),随着访问者使用这个工具的次数,可索引到的Github Page数量也随之增加。Github Page官网可以检索到所有的搜索结果,但是每次可以查看到的搜索结果限制在1000个(具体测试过程可以参考这篇文章),因此本工具提供了一次可以获取到更多结果的方式。
2018-12-21