头图

Gradio 自推出以来,每月已有超 200 万用户使用,在 AI 开发生态系统中扮演着关键角色。其简洁的代码和直观的界面,使得复杂的机器学习模型也能轻松转化为用户友好的 Web 应用,同时确保应用的安全性和可访问性。

Gradio 团队近期发布了最新版本 Gradio 5 稳定版,在实时应用和流媒体方面进行了重大升级,延迟更低,体验更流畅。为了让大家更早、更便捷地体验到 Gradio 5 的技术提升,hyper.ai 官网使用 Gradio 部署了两个热门教程,一键克隆即可使用:

  1. Depth Pro 即时生成 3D 深度图

在线运行:https://go.hyper.ai/bSp3h

  1. Pyramid Flow 一分钟生成超高清视频 Demo

在线运行:https://go.hyper.ai/njiHn

10 月 21 日-10 月 25 日,hyper.ai 官网更新速览:

  • 优质教程精选:2 个
  • 优质公共数据集:10 个
  • 社区文章精选:4 篇
  • 热门百科词条:5 条
  • 11 月截稿顶会:7 个

访问官网:hyper.ai

公共教程精选

1. Depth Pro 即时生成 3D 深度图

Depth Pro 是一个开源的零样本度量单目深度估计 (Depth Estimation) 的基础模型,它能够从单个 2D 图像快速生成高分辨率的 3D 深度图。这个模型不仅速度快,只需 0.3 秒,而且能够提供度量级别的深度信息,生成的深度图具有真实的世界尺度。该项目通过 Gradio 接口可以生成前端交互界面,相关模型和依赖已经部署完毕,一键克隆即可体验。

在线运行:https://go.hyper.ai/bSp3h

在这里插入图片描述
效果示例

2. Pyramid Flow 一分钟生成超高清视频 Demo

Pyramid Flow 是一个开源超高清视频生成模型。这个模型能够根据文本描述生成最长 10 秒、分辨率高达 1280×768 、帧率 24fps 的高质量视频。它的核心技术是金字塔流匹配算法,这种算法将视频生成过程分解为多个不同分辨率的阶段,从而提高生成效率和质量。根据教程运行容器,直接复制 API 地址,即可生成超高清视频。

在线运行:https://go.hyper.ai/njiHn

在这里插入图片描述
效果示例

💡我们还建立了 Stable Diffusion 教程交流群,欢迎小伙伴们添加神经星星微信(微信号:Hyperai01)备注【SD教程】,入群探讨各类技术问题、分享应用效果~

公共数据集精选

1. LoLI-Street 低光照图像增强数据集

这个数据集由来自发达城市街景的 33k 对低光与良好曝光图像组成,涵盖 19k 个目标类别用于目标检测。它还包括 1k 张真实低光测试图像,用于在现实条件下测试低光照图像增强 (LLIE) 模型。该数据集对于许多计算机视觉任务至关重要,包括目标检测、跟踪、分割和场景理解。相关成果已被 ACCV’24 接受。

直接使用:https://go.hyper.ai/XD7kV

在这里插入图片描述
数据集图像示例

2. BC-Z 机器人学习数据集

该数据集支持零样本 (zero-shot) 任务泛化,即让机器人能够在没有先前经验的情况下,通过模仿学习来执行新的操作任务。它包含了超过 25k 个不同的操作任务场景,涵盖了 100 种多样化的操作任务。

直接使用:https://go.hyper.ai/Lg1GC
在这里插入图片描述
BC-Z 机器人学习执行任务示例

3. Chinese Traditional Painting 中国国画数据集

该数据集包含 1k 张内容图像和 100 张风格图像。内容图片多为江南山区、湖泊、河流、桥梁、建筑等真实场景,不仅包含中国风光,还有莱茵河、阿尔卑斯山、黄石、大峡谷等美景。

直接使用:https://go.hyper.ai/wwZqs
在这里插入图片描述
数据集图像示例

4. OpenMathInstruct-2 数学指令调优数据集

该数据集包含 1,400 万对问答,其规模是此前最大同类数据集的近 8 倍。通过使用 OpenMathInstruct-2 对 Llama-3.1-8B-Base 模型进行微调,其在 MATH 数据集上的性能比 Llama3.1-8B-Instruct 提高了 15.9%(从 51.9% 提高到 67.8%)。

直接使用:https://go.hyper.ai/fxskH

在这里插入图片描述
数据集结构

5. Omni-MATH 数学推理基准数据集

这个数据集包含了 4,428 个经过严格人工标注的竞赛级数学问题,涵盖了 33 个子领域和超过 10 个不同的难度级别,从奥林匹克预备级别到顶级奥林匹克数学竞赛,如 IMO(国际数学奥林匹克)、IMC(国际数学竞赛)和普特南数学竞赛等。

直接使用:https://go.hyper.ai/tYgfN
在这里插入图片描述
数据集结构及数据示例

6. Reasoning Base 20k 推理基数数据集

该数据集旨在训练推理模型,让模型可以像人类一样思考复杂的问题,然后再做出反应。数据集包括来自不同领域(科学、编码、数学等)的各种问题,每个问题都有详细的思路链 (COT) 和正确答案。目标是使模型能够学习和改进其推理过程,识别和纠正错误,并提供高质量、详细的响应。

直接使用:https://go.hyper.ai/ssznB

7. Language-Table 机器人语言标签轨迹数据集

该数据集包含了近 600K 条带有语言标签的轨迹,用于推动更先进、更有能力、可自然语言交互的机器人发展。通过在包含数十万条带有语言注释的轨迹数据集上进行训练,研究人员发现所得的策略能够执行比以往多 10 倍的指令,这些指令描述了现实世界中的端到端视听觉-运动技能。

直接使用:https://go.hyper.ai/bUPXz

8. BridgeData V2 大规模机器人学习数据集

该数据集旨在促进可扩展机器人学习研究,它包含在 24 个不同环境中收集的超 6 万条机器人轨迹。为了增强机器人的泛化能力, 研究人员在多种环境下收集大量的任务数据,这些环境中的对象、摄像头位置和工作区定位各有不同、每条轨迹都附有与机器人任务对应的自然语言指令。

直接使用:https://go.hyper.ai/eqcYW

9. RT-1 Robot Action 真实世界机器人数据集

该数据集用于训练 RT-1 模型。数据集中涵盖的高层次技能包括捡起和放置物品、开关抽屉、从抽屉中取出和放入物品、将细长物品竖直放置、推倒物体、拉餐巾纸和开罐子,覆盖了使用多种不同物体的 700 多项任务。

直接使用:https://go.hyper.ai/8ySHu

10. MedCalc-Bench 医疗计算数据集

这个数据集包含了 10,055 个训练实例和 1,047 个测试实例,涵盖了 55 种不同的计算任务。每个实例都包括患者的笔记、一个计算特定临床值的问题、最终答案值以及逐步解决方案。MedCalc-Bench 的目的是提高 LLMs 在医疗环境中的语言和计算推理能力。

直接使用:https://go.hyper.ai/5bhzs

更多公共数据集,请访问:

https://hyper.ai/datasets

社区文章精选

1. 基于 944 种材料数据,日本东北大学联合 MIT 发布 GNNOpt 模型,成功识别数百种太阳能电池和量子候选材料

日本东北大学和麻省理工学院的研究人员推出了一种新型人工智能工具 GNNOpt,成功识别出 246 种太阳能转换效率超过 32% 的材料,以及 296 种具有高量子权重的量子材料,极大地加速了能源和量子材料的发现。本文是对研究论文的详细解读与分享。

查看完整报道:https://go.hyper.ai/3uRDH

2. 线下活动丨AI for Science 学术论坛重磅来袭,上海交大/浙江大学/清华大学/OpenBayes 等专家齐聚北京

2024 开源 AI 论坛(AI for Science 方向)将于 11 月 2 日举办!届时将有多所高校的研究人员围绕医疗健康、地理信息科学、时空复杂系统等科研领域,从学术研究与行业应用的不同角度,带来深度技术科普与行业发展趋势研判。

查看了解活动详情:https://go.hyper.ai/MiQ1O

3. 入选 ECCV 2024!浙江大学联合微软亚洲研究院提出统一医学图像预训练框架 UniMedI,打破医学数据异构化藩篱

浙江大学联合微软亚洲研究院提出了一种全新的统一医学图像预训练框架 UniMedI。它利用诊断报告作为公共语义空间,可为不同模态的医学图像创建统一的表示,成功整合了 2D 和 3D 图像,使复杂的医学数据被更好地利用。本文是对论文的详细解读与分享。

查看完整报道:https://go.hyper.ai/MXYTq

4. 诺奖和图灵奖双料得主坐镇,CuspAI 种子轮融资高达 3 千万美元,致力于应对全球气候变化

面对日益紧迫的气候变化,一场席卷全球、全行业的减碳行动正在紧锣密鼓地展开。而专注于用 AI 探索碳捕获材料的 CuspAI 更是乘风而起,于今年的 6 月 18 日 获得了高达 3 千万美元 (约 2.17 亿人民币) 的种子轮融资,成为该年欧洲规模最大的种子轮融资之一。这家初创公司到底有何魅力?阅读本文,你或许能够从中找到答案。

查看完整报道:https://go.hyper.ai/nErwd

热门百科词条精选

1. 池化 Pooling

2. 变分自编码器 VAE

3. 量子神经网络 QNN

4. 配对 t 检验 Paired t-Test

5. 数据增强 Data Augmentation

这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:

https://go.hyper.ai/wiki

11 月截稿顶会

在这里插入图片描述

一站式追踪人工智能学术顶会:https://go.hyper.ai/event

以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!

下周再见!

关于 HyperAI超神经 (hyper.ai)

HyperAI超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区,致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:

  • 为 1300+ 公开数据集提供国内加速下载节点
  • 收录 400+ 经典及流行在线教程
  • 解读 100+ AI4Science 论文案例
  • 支持 500+ 相关词条查询
  • 托管国内首个完整的 Apache TVM 中文文档

访问官网开启学习之旅:

https://hyper.ai


超神经HyperAI
1.3k 声望8.8k 粉丝