MT-BERT在文本检索任务中的实践
基于微软大规模真实场景数据的阅读理解数据集MS MARCO,美团搜索与NLP中心提出了一种针对该文本检索任务的BERT算法方案DR-BERT,该方案是第一个在官方评测指标MRR@10上突破0.4的模型。本文系DR-BERT算法在文本检索任务中的实践分享,希望对从事检索、排序相关研究的同学能够有所启发和帮助。
2020-08-24
清北「学渣」创业心路:AI 新时代已来,不参与对不起自己
内容一览:近日,HyperAI 超神经有幸接触到 SegmentFault AIGC Hackathon 2023 北京站二等奖获得者 OAISIS 团队,与他们畅聊了本次参赛的心路历程以及比赛之外团队的工作和生活。交谈中,三位年轻人显露出的自信、沉着、从容令人印象深刻。关键词:AIGC OAISIS 团队 大模型部署
构建 RAG 系统的高级技术
这篇文章分为三个部分:查询扩展和重构混合检索:密集和稀疏方法带重新排序的多阶段检索查询扩展和重构RAG 系统面临的挑战之一是用户的查询可能与知识库中使用的术语不匹配。如果使用一个好的模型来生成嵌入,这不会成为问题,因为查询的上下文很重要。但是,你永远无法知道特定查询是否会出现这种情况。查询扩展和重构...
2025-05-06
38款谷歌SEO外链工具介绍:功能及特点
在谷歌SEO的领域,外链建设是提升网站排名不可或缺的一环。为了帮助SEO专业人士和网络营销团队更好地了解并有效利用谷歌SEO工具,今天跟大家分享38款热门的外链工具,从功能到特点一一揭秘,为您的优化工作提供有力支持。
2023-12-02
大厂技术实现 | 图像检索及其在淘宝的应用 @计算机视觉系列
ShowMeAI社区的技术专家小伙伴们对图像检索的典型算法做了实现,构建了相关应用 🏆『基于CNN与三元组的图像检索实现』,对细节感兴趣的话,请前往 这里 查看实现代码参考。代码的整理花费了很多心思,欢迎大家 PR 和 Star!
2022-08-15
Python爬虫 - scrapy - 爬取豆瓣电影TOP250
新接触爬虫,经过一段时间的实践,写了几个简单爬虫,爬取豆瓣电影的爬虫例子网上有很多,但都很简单,大部分只介绍了请求页面和解析部分,对于新手而言,我希望能够有一个比较全面的实例。所以找了很多实例和文章,并整合在一起,在现有豆瓣爬虫的基础上,增加了一些内容,算是比较全的内容了。主要包括项目建立、请求...
知识图谱推理算法综述(下):基于语义的匹配模型
知识图谱系统的建设需要工程和算法的紧密配合,在工程层面,去年蚂蚁集团联合 OpenKG 开放知识图谱社区,共同发布了工业级知识图谱语义标准 OpenSPG 并开源;算法层面,蚂蚁从知识融合,知识推理,图谱应用等维度不断推进。
2024-03-28
提升影响力,打造程序员的个人品牌
前几天 @安卓大王子 在微博上给我发私信,要我一张照片,准备收集一下 GitHub 活跃用户的情况。正好我这些日子正在准备 5 月 7 号 SegmentFault 主办的 D-Day 天津场。我平时很少照相,于是翻了翻手机相册,把去年参加稀土掘金时的照片发给了他。
2016-04-14
字符串的全排列
输入一个字符串,按字典序打印出该字符串中字符的所有排列。例如输入字符串abc,则打印出由字符a,b,c所能排列出来的所有字符串abc,acb,bac,bca,cab和cba。
基于自适应margin的行人重识别的深度排序模型
假设$X=\{X_n\}_{n=1}^N$是训练样本,其中$X_n=\{X_A^n,X_B^n\}$表示第$n$个行人的训练样本,$X_n$包含了行人摄像头$A$和$B$下的图片的数据,进一步,$X_A^n=\{x_A^{n,i}\}_{i=1}^{A_n},X_B^n=\{x_B^{n,j}\}_{j=1}^{B_n}$,其中的$x_A^{n,i}$和$x_B^{n,j}$分别是第$i$个行人在$A$和$B$两个摄像头下的第$i$和第$j$张图片...
2020-05-04
6种常见的地标识别算法整理和总结
摘要:地标识别,基于深度学习及大规模图像训练,支持上千种物体识别及场景识别,广泛应用于拍照识图、幼教科普、图片分类等场景。本文将为大家带来6种关于地标识的算法整理和总结。
2021-04-19
鸿蒙版Flutter如何实现token从本地读取,不上传git
这样修改后,API Token将从本地配置文件读取,而不是硬编码在代码中。用户首次使用应用时,会弹出对话框要求设置Token。用户也可以通过点击AppBar上的新增按钮随时修改Token。
2025-03-09
Redis的n种妙用,不仅仅是缓存
redis是键值对的数据库,常用的五种数据类型为字符串类型(string),散列类型(hash),列表类型(list),集合类型(set),有序集合类型(zset)
聊聊图数据库和图数据库的小知识 Vol.02
2010 年前后,对于社交媒体网络研究的兴起带动了图计算的大规模应用。2000 年前后热门的是 信息检索 和 分析 ,主要是 Google 的带动,以及 Amazon 的 e-commerce 所用的协同过滤推荐,当时 collaborative filtering也被认为是 information retrieval 的一个细分领域,包括 Google 的 PageRank 也是在信息检索领域研究较...
2020-01-15
Web3 开发指南:使用 NFTScan NFT API 构建一个 NFT 链上追踪器
对于大多数 Web3 团队来说,构建一个完整的链上 NFT 数据追踪系统是一项具有挑战性的任务,构建一个 NFT 链上追踪器更是如此。涉及到处理区块链上的智能合约和交易数据,并将其与外部数据源进行整合和分析工作量是十分巨大的:
2023-07-12
如何使用 NFTScan NFT API 在 PlatON 网络上开发 Web3 应用
PlatON 是由万向区块链和矩阵元主导开发的面向下一代的全球计算架构,创新性的采用元计算框架 Monad 和基于 Reload 覆盖网络的同构多链架构,其愿景是成为全球首个提供完备隐私保护能力的运营服务网络。它提供计算、存储、通讯服务,并提供算力、算法、数据等众多基础资源以及公共基础设施软件开发、咨询及运营服务等。
2024-01-08
Web3.0热门领域NFT项目实战(网盘无密分享)
关于大多数 Web3 团队来说,构建一个完好的链上 NFT 数据追踪系统是一项具有应战性的任务,构建一个 NFT 链上追踪器更是如此。触及四处理区块链上的智能合约和买卖数据,并将其与外部数据源停止整合和剖析工作量是非常宏大的:
2024-01-12