头图

公共资源速递

5 个数据集:

  • Terra 多模态时空数据集
  • Chinese Couplets 中文对联数据集
  • Aqueous Solubility 无机化合物数据集
  • Human Like DPO Dataset 大模型对话微调数据集
  • Sentiment and Emotion Analysis Dataset 情感情绪分析数据集

4 个教程:

  • 一键部署 Phi-4
  • Docling:文档解析神器
  • 一键部署 QVQ-72B-preview
  • 铅笔素描风格文生图 shouxin

访问官网立即使用:http://openbayes.com

公共数据集

1. Terra 多模态时空数据集

Terra 是 1 个跨地球的多模态时空数据集,提供了全球范围内 45 年的时空数据,涵盖 648 万个高分辨率网格点,旨在促进时空数据挖掘的未来研究,推动实现更广泛的时空智能。

直接使用:

https://go.openbayes.com/4L0GG

2. Chinese Couplets 中文对联数据集

该数据集包含约 740k 对对联,fixed_couplets_in.txt 为上联文本,fixed_couplets_out.txt 为下联文本。

直接使用:

https://go.openbayes.com/hZPi3

3. Aqueous Solubility 无机化合物数据集

该数据集包含数百种无机化合物的实验水溶性数据,数据来源于多个参考文献,适用于材料信息学领域。所有溶解度数据均以每 100 克水中的溶质克数为单位表示。

直接使用:

https://go.openbayes.com/o4LF6

4. Human Like DPO Dataset 大模型对话微调数据集

该数据集涵盖了 256 个主题,包含 10,884 个样本,这些样本分布在技术、日常生活、科学、历史和艺术等多个领域。它适用于直接偏好优化 (DPO) 等格式,旨在引导模型生成更像人类的响应。

直接使用:

https://go.openbayes.com/RQxev

5. Sentiment and Emotion Analysis Dataset 情感情绪分析数据集

该数据集包含 422k 个情绪分析句子,和 3,309 个情感分析句子作为补充。情绪分析标记有 6 种不同情绪:喜悦、悲伤、愤怒、恐惧、喜爱和惊讶。

直接使用:

https://go.openbayes.com/GvUo3

公共教程

1. 一键部署 Phi-4

Phi-4 是微软开发的一个小型语言模型,旨在通过高质量的合成数据和先进的训练技术,提供高效的文本生成和复杂的推理能力。

该教程为 Phi-4 一键部署 Demo,只需克隆并启动该容器,直接打开生成的 API 地址,即可推理体验。

在线运行:

https://go.openbayes.com/p5Xz8

模型对话示例

2. Docling:文档解析神器

Docling 是一个多功能文档转换工具,旨在简化和自动化文档格式转换的过程。它支持将多种常见的文件格式(如 PDF、Word、PPTX、Markdown 等)转换为多种不同的输出格式,如文本 (Text)、Markdown、Doctags、JSON 和 YAML。

在线运行:

https://go.openbayes.com/78Oib

模型界面示例

3. 一键部署 QVQ-72B-preview

Qwen-QVQ 是一个基于 Transformer 架构的视觉语言模型 (VLM)。该模型专注于视觉-语言任务,旨在通过联合训练图像和文本数据来增强多模态推理和理解能力。它结合了先进的自然语言处理 (NLP) 和计算机视觉 (CV) 技术,能够进行多种任务,如图像描述、图像问答和视觉推理等。

该项目通过 Gradio 接口可以生成前端交互界面,相关模型和依赖已经部署完毕,一键启动即可体验。

在线运行:

https://go.openbayes.com/eEJOY

与模型对话示例

4. 铅笔素描风格文生图 shouxin

「shou_xin」是 1 个专门设计用于生成铅笔素描风格图像的视觉模型,该模型能够根据用户提供的文本提示生成高质量的铅笔素描图像,如动物、人物、自然景观等。

该项目通过 Gradio 接口可以生成前端交互界面,一键启动,复制 API 地址即可生成铅笔素描图像。

在线运行:

https://go.openbayes.com/SWhuJ

效果示例


以上就是小贝上周在 OpenBayes 的全部更新内容啦~


OpenBayes
6 声望1 粉丝

贝式计算是中国领先的高性能计算服务提供商,通过为新一代异构芯片嫁接经典软件生态及机器学习模型,向工业企业及高效科研院所提供更加快速、易用的数据科学计算产品。