公共资源速递
This Weekly Snapshots !
5 个数据集:
- DreamBench++ 图像自动评估基准数据集
- DreamBooth 图像数据集
- HellaSwag 大模型常识推理数据集
- MMDU 超长多图多轮对话理解数据集
- Test of Time 大模型时间推理能力的基准测试数据集
1 个模型:
- Gemma-2-9B-Chinese-Chat
2 个教程:
- 腾讯 HunyuanDiT Demo
- Fish Speech 声音克隆-文本转语音工具 Demo
访问官网立即使用:http://openbayes.com
公共数据集
DreamBench++ 是一个包含 200 个关键词的个性化数据集,涵盖物体、活物和风格化图片三种类型。该数据集旨在解决个性化图像生成技术评估中存在的问题,它通过引入支持多模态的 GPT-4o,实现了与人类偏好的深度对齐和自动化评估。
直接使用:
https://go.openbayes.com/XEo0V
该数据集包含 30 个不同类别的主体,包括 9 个活体主体(例如狗和猫)和 21 个对象,每个主体有 4 到 6 张图片。这些图片通常在不同的条件、环境和角度下拍摄,以确保模型能够学习到主体在不同情境下的外观。
直接使用:
https://go.openbayes.com/cekhr
HellaSwag 数据集是一个用于测试常识性自然语言推理的挑战数据集,包含 7 万个问题,旨在通过构建一个对现有最先进模型具有挑战性的数据集,来探索深度预训练模型在常识推理方面的表现。相关论文已被 ACL 2019 接受。
直接使用:
https://go.openbayes.com/nNBW5
该数据集包括 110 个高质量的多图像多轮对话,其中包含 1.6k 个问题,每个问题都附有详细的长篇答案。MMUD 中的问题涉及 2 到 20 张图像,平均图像和文本标记长度为 8.2k 个标记,最大图像和文本长度达到 18K 个标记,对现有的多模态大型模型提出了重大挑战。
直接使用:
https://go.openbayes.com/e7qBQ
5. Test of Time 大模型时间推理能力的基准测试数据集
该数据集简称 ToT,分为三个子集:ToT-semantic 包含 1,850 个示例、ToT-arithmetic 包含 2,800 个示例、ToT-semantic-large 包含 46,480 个示例,ToT 数据集能够在更大的尺度上衡量时间理解的语义和逻辑。
直接使用:
https://go.openbayes.com/Y2LCq
公共模型
该模型是首个基于 Google/Gemma-2-9B-it 构建的指令调优语言模型,专门针对中文和英文用户进行了微调,显著减少了「中文问题带英文答案」和中英文混合的问题,还提升了逻辑推理、编程、数学及写作能力。
直接使用:
https://go.openbayes.com/3E33M
公共教程
HunyuanDiT 是首个中英双语 DiT 架构的文本到图像生成模型,具有中英文细粒度理解能力,能够与用户进行多轮对话、根据上下文生成并完善图像。该教程已经为大家搭建好了相关环境,一键克隆即可体验。
在线运行:
https://go.openbayes.com/Eno9t
2. Fish Speech 声音克隆-文本转语音工具 Demo
Fish Speech 是由 Fish Audio 开发的开源文本转语音模型,能熟练掌握中文、日语和英语,其语言处理接近人类水平且声音表现多样。该教程是其 Demo,并安装好了相关依赖,欢迎克隆容器生成专属音频。
在线运行:
https://go.openbayes.com/HP7OI
以上就是小贝上周在 OpenBayes 的全部更新内容啦~
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。