Advanced RAG 10:引入检索评估、知识精练的 CRAG 技术详解
编者按:本文介绍的 CRAG 技术通过引入轻量级检索评估机制和知识精炼算法,试图解决传统检索增强生成(RAG)方法在处理复杂查询语句时存在的问题(包括检索结果不够精确、引入无关信息等),这些问题会影响模型回答的质量。CRAG 技术如何评估检索文档与用户查询之间的相关性?检索评估器的具体工作原理是什么?CRAG的知...
对话摘要技术在美团的探索(SIGIR)
随着互联网产生的文本数据越来越多,文本信息过载问题日益严重,对各类文本进行一个“降维”处理显得非常必要,而文本摘要就是其中一个重要的手段。本文首先介绍了经典的文本摘要方法,包括抽取式摘要方法和生成式摘要方法,随后分析了对话摘要的模型,并分享了美团在真实对话摘要场景中面临的挑战。希望能给从事相关工作...
端智能在大众点评搜索重排序的应用实践
端智能,是指在移动端设备运行人工智能(AI)应用的技术。本文主要讲述大众点评搜索场景下,在端侧部署大规模深度学习模型进行搜索重排序任务的实践方案,包括端上特征工程、模型迭代思路,以及具体部署优化的过程,希望能对从事相关领域开发的同学有所帮助或者启发。
2022-05-20
融合非负矩阵分解和图全变分的歌曲推荐算法
摘 要:本文正式地形式化一个全新的的歌曲推荐算法,其将歌曲推荐的问题转化为矩阵补全的问题来考虑,并通过基于非负矩阵分解(non-negative matrix factorization, NMF)的协同过滤算法以及图上的结合图的全变分(total variation, TV)的基于内容的过滤方法相结合来解决这个问题。相关的图通过使用音频、元数据以及社...
2018-04-28
融合非负矩阵分解和图全变分的歌曲推荐算法
摘要: Kirell Benzi, Vassilis Kalofolias, Xavier Bresson and Pierre Vandergheynst Signal Processing Laboratory 2 (LTS2), Swiss Federal Institute of Technology (EPFL)
我项目中的代码都是如何分层的?
说起应用分层,大部分人都会认为这个不是很简单嘛 就controller,service, mapper三层。看起来简单,很多人其实并没有把他们职责划分开,在很多代码中,controller做的逻辑比service还多,service往往当成透传了,这其实是很多人开发代码都没有注意到的地方,反正功能也能用,至于放哪无所谓呗。这样往往造成后面代码无法...
60TB 数据量的作业从 Hive 迁移到 Spark 在 Facebook 的实践
Facebook 经常使用分析来进行数据驱动的决策。在过去的几年里,用户和产品都得到了增长,使得我们分析引擎中单个查询的数据量达到了数十TB。我们的一些批处理分析都是基于 Hive 平台(Apache Hive 是 Facebook 在2009年贡献给社区的)和 Corona( Facebook 内部的 MapReduce 实现)进行的。Facebook 还针对包括 Hive 在...
某在线视频播放小程序项目总结
某在线视频播放小程序项目总结 1.项目简介 一款为家庭用户设计的实用技能学习平台,在tv端和小程序端都可以通过平台选择感兴趣的视频进行学习,小程序端主要功能包括3个tabBar: 视频分类展示 我的课程:最近学习课程、已有课程、收藏课程 个人账号管理:同步电视学习、意见反馈等 2. 主要工作和疑难点汇总 2.1 主要工作 ...
【OpenMLDB Meetup #1】会议纪要
OpenMLDB 社区于 2022 年 1 月 15 日举行了第一次面向整个社区的 meetup,不仅由 OpenMLDB 的核心开发团队分享了整体架构以及 v0.4.0 的新特性演示,而且邀请到了 OpenMLDB 的企业客户 - Akulaku 来分享基于 OpenMLDB 的实时特征计算实战场景。
2022-01-20
苦尽甘来之国产数据库风云榜-2022年03月
关系型数据库分为:OLAP、OLTP、HATP(混合事务/分析处理,Hybrid Transactional/Analytical Processing)
2022-03-24
KDD 2023 | 美团技术团队精选论文解读
本文精选了美团技术团队被KDD 2023收录的7篇论文进行解读,论文覆盖了Feed流推荐、多模态数据、实例分割、用户意图预测等多个方向。这些论文也是美团技术团队与国内多所高校、科研机构合作的成果。希望给从事相关研究工作的同学带来一些启发或者帮助。
用上GAN的推荐算法成精了,看完视频马上刷出相关文章丨KDD 2021
这年头,推荐算法真是越来越智能了。举个栗子,当你热衷于东京奥运会并且刷了不少剪辑视频,APP就会根据你的品味为你推荐文章、游戏或是同款周边。没错,推荐算法早已不局限于一个场景,而是在视频、文章、小程序等各种场景中“打通任督二脉”,也就是多领域推荐算法。但事实上,这类算法并不如想象中容易驾驭,关键在于如...
2021-08-19
大众点评搜索基于知识图谱的深度学习排序实践
搜索是大众点评App上用户进行信息查找的最大入口,是连接用户和信息的重要纽带。而用户搜索的方式和场景非常多样,并且由于对接业务种类多,流量差异大,为大众点评搜索(下文简称点评搜索)带来了巨大的挑战,具体体现在如下几个方面:
从0到1操作MySQL数据库
人类在进化的过程中,创造了数字、文字、符号等来进行数据的记录,往石头和龟壳上面画上,到时候一数,但是承受着认知能力和创造能力的提升,数据量越来越大,对于数据的记录和准确查找,成为了一个重大难题
2018-01-11
Deno 钻研之术:(1) Hello,从多样化安装到简单实战
《Deno 钻研之术》系列于 Deno v1 正式发售之日全新推出,每周不定期更新在 Github 中([链接])。让我们一起循序渐进学 Deno,先易后难补 Node,面向未来开发属于自己的 Deno Web App。欢迎订阅,欢迎交流。
大厂技术实现 | 爱奇艺短视频推荐业务中的多目标优化实践 @推荐与计算广告系列
本篇内容使用到的数据集为 🏆2021微信大数据挑战赛数据集,大家可以通过 ShowMeAI 的百度网盘地址快速下载。数据集和代码的整理花费了很多心思,欢迎大家 PR 和 Star!
知识图谱之图数据库如何选型:知识图谱存储与图数据库总结、主流图数据库对比
知识图谱之图数据库如何选型:知识图谱存储与图数据库总结、主流图数据库对比(JanusGraph、HugeGraph、Neo4j、Dgraph、NebulaGraph、Tugrapg)图数据库每月排名 1.知识图谱1.1 KG简单知识点数据模型知识图谱的两种主流数据模型(数据的结构、操作和约束):RDF 图模型和属性图模型数据模型特性数据模型特性RDF 图模型属...
2024-01-26