找到约 10000 条结果
  • Meta提出用向量检索来改进图像描述模型
    随着深度神经网络的发展,自动图像描述技术取得了令人瞩目的进展。然而,现有的方法主要注重生成的描述与人类参考描述之间的相似性,却忽视了描述在实际应用中的特定目标。Meta FAIR实验室一项最新研究提出了一种改进方法,通过引入判别性目标和强化学习,使得神经网络生成的图像描述更具信息量和可理解性,为实际应用带...
    2023-06-30
  • HMS Core 3D流体仿真技术,打造移动端PC级流体动效
    移动设备硬件的高速发展,让游戏行业发生翻天覆地的变化,许多酷炫的游戏效果不再局限于电脑端,玩家在移动端就能享受到场景更逼真、画质更清晰、体验更流畅的游戏服务。但由于移动设备算力不足,为了实现真实感的水体效果,很多游戏厂商采用预计算的方法减少实时仿真的计算开销,但水体场景在移动端的流体效果仍然不佳。
    2022-12-26
  • 基于Transformers.js的移除照片背景
    本文由ScriptEcho平台提供技术支持项目地址:传送门## 基于 AI 的图像去背景工具应用场景该代码可用于从图像中自动去除背景,提取前景对象。它广泛应用于以下场景:电子商务产品摄影社交媒体图像编辑图形设计照片合成代码基本功能该代码利用人工智能技术,实现了以下基本功能:图像预处理:将图像调整为模型要求的尺寸和...
    2024-05-23
    1
  • 性能无损,模型隐私保护效果提升50%!蚂蚁数科创新跨域微调框架| AAAI 2025 Oral
    AAAI 2025期间,蚂蚁数科、浙江大学、利物浦大学和华东师范大学联合团队提出了一种创新的跨域微调框架ScaleOT,可以实现在模型性能无损的前提下,将模型隐私保护效果提升50%。
    2025-03-03
  • DVT:华为提出动态级联Vision Transformer,性能杠杠的 | NeurIPS 2021
    论文主要处理Vision Transformer中的性能问题,采用推理速度不同的级联模型进行速度优化,搭配层级间的特征复用和自注意力关系复用来提升准确率。从实验结果来看,性能提升不错 来源:晓飞的算法工程笔记 公众号
    2024-07-03
  • 次世代建模纹理贴图怎么做?
    "次世代建模"是一个术语,通常用来描述在计算机图形学和游戏开发领域中的一种高品质的建模技术和流程。它指的是创建逼真且高度细致的数字模型,以用于创建视觉效果和游戏中的虚拟场景和角色。
    2023-11-29
  • 深度学习在携程攻略社区的应用
    编者:本文来自携程攻略社区开发总监李健在携程技术中心主办的深度学习Meetup中的主题演讲,介绍了深度学习在攻略社区领域的主要应用。关注携程技术中心微信公号ctriptech,可获知更多技术分享信息。文末可下载演讲PPT。
    2016-08-01
  • 图片竟能直接生成逼真音效?这AI模型也太神奇了吧!
    导读:如今的AI技术发展堪称“very神奇”,文字、图片竟能一键直接生成逼真音效,嗯,妥妥都是因为TA,一款在语音音频领域“横空出世”的新模型:Make-An-Audio。
    2023-02-09
  • 拓端tecdat|matlab实现扩展卡尔曼滤波(EKF)进行故障检测
    本文展示了如何使用扩展卡尔曼滤波器进行故障检测。本文使用扩展的卡尔曼滤波器对一个简单的直流电机的摩擦力进行在线估计。估计的摩擦力的重大变化被检测出来,并表明存在故障。
    2021-05-12
  • 多模态大模型改造人脸防伪检测,厦大腾讯优图等研究入选CVPR 2025
    近年来,人脸合成技术在快速发展,相关检测任务也逐渐从“看得出来”向“说明白为什么”演进。除了判断一张脸是真还是假,更需要模型能“说出个所以然”。
    2025-04-21
  • R语言近似贝叶斯计算MCMC(ABC-MCMC)轨迹图和边缘图可视化|附代码数据
    一位同事向我询问我们在文章中讨论过的近似贝叶斯计算 MCMC (ABC-MCMC) 算法的简单示例。下面,我提供了一个最小的示例,类似于Metropolis-Hastings 。
    2023-06-28
  • BT - Unet:生物医学图像分割的自监督学习框架
    BT-Unet采用Barlow twin方法对U-Net模型的编码器进行无监督的预训练减少冗余信息,以学习数据表示。之后,对完整网络进行微调以执行实际的分割。
    2022-11-27
  • 8张GPU训出近SOTA模型,超低成本图像生成预训练方案开源
    超低成本图像生成预训练方案来了——仅需8张GPU训练,就能实现近SOTA的高质量图像生成效果。划重点:开源。模型名为LightGen,由港科大Harry Yang团队联合Everlyn AI等机构打造,借助知识蒸馏(KD)和直接偏好优化(DPO)策略,有效压缩了大规模图像生成模型的训练流程。LightGen不仅显著降低了数据规模与计算资源需求,而...
    2025-03-19
  • DDColor:极致丝滑的上色体验
    随着深度学习的兴起,自动着色引起了很多关注,其目标是根据复杂的图像语义(形状,纹理和上下文)自动生成合适的颜色。一些早期的方法例如CIC、InstColot、DeOldify等试图使用卷积神经网络来预测每个像素的颜色分布,但由于缺乏对图像语义学的全面理解,经常会产生不正确或不饱和的着色结果。DDColor是一个由阿里达摩院...
    2024-04-16
  • 谷歌AI良心开源:一部手机就能完成3D目标检测,还是实时的那种
    在2D图像中做3D目标检测很难?现在,拿着一部手机就能做到,还是实时的那种。这就是谷歌AI今天发布的MediaPipe Objectron,一个可以实时3D目标检测的pipeline。分开来看:MediaPipe是一个开源的跨平台框架,用于构建pipeline来处理不同模式的感知数据。Objectron在移动设备上实时计算面向对象的3D边界框。日常生活中的物...
    2020-03-12
  • R语言分布滞后线性和非线性模型(DLMs和DLNMs)分析时间序列数据|附代码数据
    本文演示了在时间序列分析中应用分布滞后线性和非线性模型(DLMs和DLNMs)。Gasparrini等人[2010]和Gasparrini[2011]阐述了DLMs和DLNMs的发展以及时间序列数据的实现 ( 点击文末“阅读原文”获取完整代码数据 )。
    2023-07-12
  • R语言分布滞后线性和非线性模型(DLMs和DLNMs)分析时间序列数据|附代码数据
    本文演示了在时间序列分析中应用分布滞后线性和非线性模型(DLMs和DLNMs)。Gasparrini等人[2010]和Gasparrini[2011]阐述了DLMs和DLNMs的发展以及时间序列数据的实现
    2023-06-07