公共资源速递
This Weekly Snapshots !
5 个数据集:
- Llama3 中文化数据集
- 皮马印第安人糖尿病数据集
- VehicleID 车辆识别数据集
- LCCC 大规模净化汉语会话语料库
- NWPU VHR-10 地理空间物体检测遥感数据集
2 个模型:
- YOLOv10
- Llama 3-Chinese-Chat-8b
2 个教程:
- YOLOv10 实时端到端物体检测应用
- 一键部署 Llama 3-Chinese-Chat-8b
访问官网立即使用:http://openbayes.com
公共数据集
该数据集为 Llama3 中文化数据集集合,数据已统一处理为 firefly 格式,可以配合 firefly 工具直接训练 Llama3 中文模型。
直接使用:https://go.openbayes.com/zDgQG
该数据集是医疗保健和机器学习领域中一个著名的数据存储库,包含了皮马印第安妇女的人口统计、临床和诊断特征,主要用于基于这些属性预测糖尿病的发病情况。
直接使用:https://go.openbayes.com/ZWgbd
该数据集包含 26,267 辆车的共 221,763 张图像,每张图像都带有一个与其在现实世界相对应 ID 标注。
直接使用:https://go.openbayes.com/Pb6Ig
该数据集包含两个版本:LCCC-base 和 LCCC-large,分别包含了 680 万条和 1,200 万条经过清洗的对话。LCCC 旨在推动中文对话生成领域的研究,提供了高质量的中文对话数据,这些数据经过严格的清洗流程,以确保数据的质量。
直接使用:https://go.openbayes.com/uR56s
该数据集共有 800 张图像,其中包含目标有的 650 张,背景图像有 150 张,目标包括:飞机、舰船、油罐、棒球场、网球场、篮球场、田径场、港口、桥梁、车辆 10 个类别。
直接使用:https://go.openbayes.com/3PSqZ
公共模型
YOLOv10 是由清华大学基于 Ultralytics Python 包开发的实时目标检测方法。它通过消除非最大抑制 (NMS) 和优化模型架构,解决了 YOLO 系列之前版本在后处理和模型架构方面的不足。
直接使用:https://go.openbayes.com/S2Ssj
该模型是基于 Meta-Llama-3-8b-Instruct 模型专门针对中文进行微调的中文聊天模型。与原始的 Meta-Llama-3-8b-Instruct 模型相比,该模型显著减少了「中文问题英文回复」以及中英文混合的问题。
直接使用:https://go.openbayes.com/RcvMs
公共教程
YOLOv10 是由清华大学开发的实时目标检测方法,旨在解决之前 YOLO 版本在后处理和模型架构方面的不足。该教程为 YOLOv10 的 gradio 应用教程。
在线运行:https://go.openbayes.com/OIe07
2. 一键部署 Llama 3-Chinese-Chat-8b Demo
该教程使用的模型为上文提到的首个 Llama 3 中文版,是一个面向中文和英文用户进行了指令微调的语言模型,具备角色扮演和工具使用等多种能力。只需克隆并启动该容器,直接复制生成的 API 地址,即可对模型进行推理体验。
在线运行:https://go.openbayes.com/a239e
以上就是小贝上周在 OpenBayes 的全部更新内容啦~
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。