公共资源速递
5 个数据集:
- Terra 多模态时空数据集
- Chinese Couplets 中文对联数据集
- Aqueous Solubility 无机化合物数据集
- Human Like DPO Dataset 大模型对话微调数据集
- Sentiment and Emotion Analysis Dataset 情感情绪分析数据集
4 个教程:
- 一键部署 Phi-4
- Docling:文档解析神器
- 一键部署 QVQ-72B-preview
- 铅笔素描风格文生图 shouxin
访问官网立即使用:http://openbayes.com
公共数据集
Terra 是 1 个跨地球的多模态时空数据集,提供了全球范围内 45 年的时空数据,涵盖 648 万个高分辨率网格点,旨在促进时空数据挖掘的未来研究,推动实现更广泛的时空智能。
直接使用:
https://go.openbayes.com/4L0GG
该数据集包含约 740k 对对联,fixed_couplets_in.txt 为上联文本,fixed_couplets_out.txt 为下联文本。
直接使用:
https://go.openbayes.com/hZPi3
3. Aqueous Solubility 无机化合物数据集
该数据集包含数百种无机化合物的实验水溶性数据,数据来源于多个参考文献,适用于材料信息学领域。所有溶解度数据均以每 100 克水中的溶质克数为单位表示。
直接使用:
https://go.openbayes.com/o4LF6
4. Human Like DPO Dataset 大模型对话微调数据集
该数据集涵盖了 256 个主题,包含 10,884 个样本,这些样本分布在技术、日常生活、科学、历史和艺术等多个领域。它适用于直接偏好优化 (DPO) 等格式,旨在引导模型生成更像人类的响应。
直接使用:
https://go.openbayes.com/RQxev
5. Sentiment and Emotion Analysis Dataset 情感情绪分析数据集
该数据集包含 422k 个情绪分析句子,和 3,309 个情感分析句子作为补充。情绪分析标记有 6 种不同情绪:喜悦、悲伤、愤怒、恐惧、喜爱和惊讶。
直接使用:
https://go.openbayes.com/GvUo3
公共教程
Phi-4 是微软开发的一个小型语言模型,旨在通过高质量的合成数据和先进的训练技术,提供高效的文本生成和复杂的推理能力。
该教程为 Phi-4 一键部署 Demo,只需克隆并启动该容器,直接打开生成的 API 地址,即可推理体验。
在线运行:
https://go.openbayes.com/p5Xz8
模型对话示例
Docling 是一个多功能文档转换工具,旨在简化和自动化文档格式转换的过程。它支持将多种常见的文件格式(如 PDF、Word、PPTX、Markdown 等)转换为多种不同的输出格式,如文本 (Text)、Markdown、Doctags、JSON 和 YAML。
在线运行:
https://go.openbayes.com/78Oib
模型界面示例
Qwen-QVQ 是一个基于 Transformer 架构的视觉语言模型 (VLM)。该模型专注于视觉-语言任务,旨在通过联合训练图像和文本数据来增强多模态推理和理解能力。它结合了先进的自然语言处理 (NLP) 和计算机视觉 (CV) 技术,能够进行多种任务,如图像描述、图像问答和视觉推理等。
该项目通过 Gradio 接口可以生成前端交互界面,相关模型和依赖已经部署完毕,一键启动即可体验。
在线运行:
https://go.openbayes.com/eEJOY
与模型对话示例
「shou_xin」是 1 个专门设计用于生成铅笔素描风格图像的视觉模型,该模型能够根据用户提供的文本提示生成高质量的铅笔素描图像,如动物、人物、自然景观等。
该项目通过 Gradio 接口可以生成前端交互界面,一键启动,复制 API 地址即可生成铅笔素描图像。
在线运行:
https://go.openbayes.com/SWhuJ
效果示例
以上就是小贝上周在 OpenBayes 的全部更新内容啦~
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。