头图

去年 11 月,腾讯推出 Hunyuan3D 生成模型,是业界首个同时支持文字和图像生成 3D 的开源大模型。紧接着不到一个月,微软便发布了全新框架 TRELLIS,加入 3D 资产生成领域的竞争中。TRELLIS 支持多格式输出,包括辐射场、3D 高斯和网格,为不同需求提供最大灵活性。

两个模型现均已上线 hyper.ai 超神经官网,快来试试哪个更胜一筹吧~

在线使用 Hunyuan3D:https://go.hyper.ai/Rsrno

在线使用 TRELLIS:https://go.hyper.ai/JE5s5

1 月 6 日-1 月 11 日,hyper.ai 官网更新速览:

  • 优质公共数据集:10 个
  • 优质教程精选:6 个
  • 社区文章精选:8 篇
  • 热门百科词条:5 条
  • 1 月截稿顶会:7 个

访问官网:hyper.ai

公共数据集精选

1. VSI-Bench 视觉空间智能基准测试集

该数据集包含超过 5k 个问题-答案对,覆盖近 290 个真实室内场景视频,涉及住宅、办公室和工厂等多种环境,涵盖了物体识别、位置关系、动作预测等多个方面的问题。

直接使用:https://go.hyper.ai/q0DYA

在这里插入图片描述

VSI-Bench 的任务演示

2. Facial Feature Extraction Dataset 面部特征提取数据集

该数据集是一个包含 750 张图像的标记数据集,用于检测脸部的眉毛、眼睛、鼻子、嘴唇、胡须区域。数据标记过程在 Roboflow 中执行,以 YOLOv8 格式从导出。

直接使用:https://go.hyper.ai/O3kER

在这里插入图片描述

数据集示例

3. Sentiment and Emotion Analysis Dataset 情感情绪分析数据集

该数据集包含 422,000 个情绪分析句子,和 3,309 个情感分析句子作为补充。情绪分析标记有 6 种不同情绪:喜悦、悲伤、愤怒、恐惧、喜爱和惊讶。

直接使用:https://go.hyper.ai/wFNO6

4. Eurus-2-RL-Data 数学编程问题训练数据集

该数据集是一个专门用于强化学习训练的高质量数据集,主要应用于数学和编程问题的解决,包含了约 455k 个数学问题和 27k 个编程问题。

直接使用:https://go.hyper.ai/Wdo1k

5. Medical o1 Reasoning SFT 医学推理数据集

该数据集专为微调 HuatuoGPT-o1 这一医学大语言模型而设计,旨在提升其在复杂医学推理任务中的表现。数据集的构建依赖于 GPT-4o,通过搜索可验证的医学问题并利用医学验证器进行答案验证,确保了数据的准确性和可靠性。

直接使用:https://go.hyper.ai/XMtXp

6. MCTS 中文文本简化数据集

该数据集包含 723 条基于 Penn Chinese Treebank (CTB) 的标准、选自新闻语料的复杂结构句子,并且每一句都配有多个人工简化的版本,从而成为中文文本简化任务上规模最大、参考最多的评估数据集。

直接使用:https://go.hyper.ai/UR3CN

7. educhat-sft-002-data-osm 教育领域对话数据集

该数据集包含了 400 万个数据点,包含了多样化的教育垂直领域数据,如开放问答、作文批改、启发式教学、情感支持和课程辅导等。

直接使用:https://go.hyper.ai/nQw0K

8. GOAT 算数任务微调数据集

此数据集有 dataset.json 和 dataset.ipynb 两个文件。dataset.json 文件包含约 170 万个由 dataset.ipynb 生成的、用于算术任务的合成数据。

直接使用:https://go.hyper.ai/8ZAvG

9. NaturalProofs 数学推理数据集

该数据集是一个用于研究自然语言中数学推理的多领域语料库,它包含了大约 30k 个定理陈述和证明、15k 个定义以及 2k 个额外页面(例如公理、推论),这些内容都是用自然数学语言编写的。

直接使用:https://go.hyper.ai/Bk4WE

10. TransGPT-pt&sft 交通对话预训练数据集

该数据集为国内首款综合交通大模型 TransGPT 的一部分,包含约 34.6 万条交通领域文本数据,这些数据用于领域内预训练,以及约 5.8 万条交通领域对话数据,用于微调。

直接使用:https://go.hyper.ai/vuDHa

公共教程精选

1. Hunyuan3D:仅需 10 秒生成 3D 资产

Hunyuan3D 是 3D 生成扩散模型模型,包括一个轻量版和一个标准版,均支持从文本和图像输入生成高质量的 3D 资产。经过定性和定量的多维度评估,Hunyuan3D-1.0 在几何细节、纹理细节、纹理-几何一致性、 3D 合理性、指令遵循等方面的表现都非常出色。

本教程是 Hunyuan3D 轻量版,点击下方链接,按照教程指引即可体验 3D 模型生成。

在线运行:https://go.hyper.ai/Rsrno

在这里插入图片描述

效果示例

2. TRELLIS:微软开源的 3D 资产生成模型 Demo

TRELLIS 是微软 (Microsoft) 团队于 2024 年开发的一个基于图神经网络的可解释性框架,旨在通过学习图结构数据的特征,提供高效的模型可解释性。

该模型与环境已经部署完毕,根据教程指引即可使用大模型进行图像转 3D 影像。

在线运行:https://go.hyper.ai/JE5s5

在这里插入图片描述

效果示例

3.快速部署 ChatGLM2-6b-32k

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于通用语言模型 (GLM) 架构,拥有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地(INT4 量化)等级下最低只需 6 GB 显存)。

按照教程步骤操作,直接复制生成的 API 地址,即可使用 ChatGLM-6B。

在线运行:https://go.hyper.ai/B0b7V

在这里插入图片描述

模型 web 界面

4. 使用 NLTK 进行自然语言处理

NLTK 是使用自然语言数据创建 Python 程序的最流行的平台之一。除了用于分类、标记化、词干、标记、解析和语义推理的文本处理库以外,它还为 50 多个大型结构化文本数据集(语料库)和词汇资源提供了简单的接口。

本教程将介绍如何使用 NLTK 在文本处理阶段进行各种 NLP 操作,并借助一些用于情感分析文本分类的 NLTK 工具创建 Keras 模型。

在线运行:https://go.hyper.ai/BFZ10

在这里插入图片描述

词频分布示例

5. Audio LDM 音频编辑教程

AudioLDM 是一种潜在的文本到音频扩散模型,能够在给定任何文本输入的情况下生成真实的音频样本。AudioLDM 将文本提示作为输入并预测相应的音频。它可以生成文本条件音效、人类语音和音乐。

该项目通过 Gradio 接口可以生成前端交互界面,相关模型和依赖已经部署完毕,点击下方链接即可编辑音频。

在线运行:https://go.hyper.ai/BCOWL

6. ShowUI:专注 GUI 自动化的视觉-语言-动作模型

ShowUI 模型通过理解屏幕界面的内容,并执行如点击、输入、滚动等交互动作,支持网页和手机应用场景,能够自动完成复杂的用户界面任务。ShowUI 能够解析屏幕截图和用户指令,进而预测出界面上的交互动作。

该教程为模型一键部署 Demo,只需克隆并启动该容器,直接复制生成的 API 地址,即可对模型进行体验。

在线运行:https://go.hyper.ai/reHs7

在这里插入图片描述

模型 web 界面

💡我们还建立了 Stable Diffusion 教程交流群,欢迎小伙伴们添加神经星星微信(微信号:Hyperai01)备注【SD教程】,入群探讨各类技术问题、分享应用效果~

社区文章精选

1. 10大圣诞数据集汇总:热门歌曲/礼物愿望清单/菜谱/10年间圣诞推特文案……

圣诞节期间,HyperAI超神经为大家准备了 10 个圣诞节相关的数据集,支持在线使用与加速下载,快来体验吧。

查看数据集汇总:https://go.hyper.ai/if7Lc

2. 成本下降 100 倍!非营利组织 E11 Bio 新成果,绘制大脑数百万细胞连接关系

生物科技公司 E11 Bio 推出 PRISM 技术,能够以极低成本绘制整个大脑中数百万个细胞的连接关系,这一系列创新使得全脑连接组学的整体成本预计下降至少 100 倍,为未来探索人类大脑提供了可能。本文是对该企业的详细报道,点击速看。

查看完整报道:https://go.hyper.ai/ISc4j

3. 多国政策/科研突破/先锋人物/企业布局……一文看尽 2024 年 AI4S 行业大事

HyperAI超神经为大家梳理盘点了 2024 年 AI for Science 领域的高影响力事件。点击查看详细报道。

查看完整报道:https://go.hyper.ai/d2Dlv

4. 全球变暖难逆转,斯坦福团队用 AI 预测最高温变化,破纪录可能性达 90%

在全球持续变暖等大背景下,罕见的极端气候事件开始频发。斯坦福大学、科罗拉多州立大学与苏黎世联邦理工学院的研究团队,通过将人工智能卷积神经网络系统用于全球变暖预测,发现即便我们能够实现快速减排,全球气温仍有 90% 的可能性持续升高。本文是对论文的详细解读与分享。

查看完整报道:https://go.hyper.ai/vDt3e

5. 模拟人类反应式抓取过程,普渡大学团队实现机器人学习的数据高效触觉表征

普渡大学三年级博士生徐政通以「面向机器人学习的数据高效触觉表征」为题,向大家分享了反应式抓取控制器 LeTac-MPC 和用于机器人统一触觉表示的 UniT 两大科研成果。本文是对分享内容的整理汇总,点击速看。

查看完整报道:https://go.hyper.ai/IPIjj

6. 五战蛋白质结构预测风向标 CASP,南开大学郑伟:竞争性与难度提升,关注实际生物问题

CASP 一直以来被行业看作是蛋白质结构预测的风向标。 在此背景下,HyperAI超神经有幸与郑伟教授进行了一次深度访谈,透过具有行业风向标意义的国际大赛 CASP,他为我们剖析了当下蛋白质结构预测领域的发展趋势。干货满满,点击速看。

查看完整报道:https://go.hyper.ai/Y83iz

7. 坚守 30 年,麻省理工学院瞄定下一代锂电池,用生成式 AI 实现固态电解质重大突破

麻省理工学院和丰田研究所的研究团队在一项最新研究中深入研究了不同先进生成式模型在聚合物生成中的复杂性,并提出了一种可以持续生成和评估新的基于 GPT 和扩散模型的聚合物电解质的从头设计方法,为实验检验提供了新的候选物。本文是对论文的详细解读与分享。

查看完整报道:https://go.hyper.ai/PDc8J

8. 刚刚!世界最快GPU RTX 5090官宣售价超1.4万元,国行阉割版5090 D定价超1.6万元

在 CES 2025 大会上,英伟达 RTX 5090 正式官宣,是迄今为止速度最快的 GeForce RTX GPU,首发价 1.4 万元,国行版 5090 D 售价 1.6 万元。RTX 5090 还增加了 FP4 支持,与上一代产品相比,内存占用空间更小,运行生成式 AI 模型的速度提高了 2 倍。本文是对该产品的详细介绍,点击速看。

查看完整报道:https://go.hyper.ai/dyyZS

热门百科词条精选

  1. 核范数 Nuclear Norm
  2. 配对 t 检验 Paired t-Test
  3. 大规模多任务语言理解 MMLU
  4. Sigmoid 函数 Sigmoid function
  5. 最小二乘法 The least square method

这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:

https://go.hyper.ai/wiki

1 月截稿顶会

在这里插入图片描述

一站式追踪人工智能学术顶会:https://go.hyper.ai/event

以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!

下周再见!

关于 HyperAI超神经 (hyper.ai)

HyperAI超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区,致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:

  • 为 1700+ 公开数据集提供国内加速下载节点
  • 收录 500+ 经典及流行在线教程
  • 解读 200+ AI4Science 论文案例
  • 支持 600+ 相关词条查询
  • 托管国内首个完整的 Apache TVM 中文文档

访问官网开启学习之旅:

https://hyper.ai


超神经HyperAI
1.3k 声望8.8k 粉丝