头图

近日,纽约大学计算机科学助理教授、Yann LeCun 的学生——Alfredo Canziani 公开了自己的春季「AI 课程」,内容覆盖离散概率和朴素贝叶斯、感知机和逻辑回归、优化、统计和神经自然语言处理、神经网络分类、循环神经网络和卷积神经网络等主题。
本周 HyperAI超神经将在 B 站 7×24h 直播该课程,一起来学习吧~

观看地址:

http://live.bilibili.com/26483094

6 月 24 日-6 月 28 日,hyper.ai 官网更新速览:

  • 优质公共数据集:10 个
  • 优质教程精选:3 个
  • 社区文章精选:4 篇
  • 热门百科词条:5 条
  • 7 月截稿顶会:4 个

访问官网:hyper.ai

公共数据集精选

1. GeoChat Instruct 遥感多模态指令跟踪数据集

该数据集包含近 31.8 万条指令,旨在扩展多模态指令调整到遥感领域,以训练多任务会话助理。相关论文成果已被 CVPR 2024 接受。

直接使用:https://go.hyper.ai/CXu0K

2. RRSIS-D 大型遥感图像分割数据集

该数据集包含 17,402 个图像-描述-掩码三元组,覆盖多种空间分辨率和物体方向。相关论文成果已被 CVPR 2024 接受。

直接使用:https://go.hyper.ai/1VRQG

3. Earth Parser Dataset 遥感测绘数据集

该数据集是用于训练和评估大型、未经整理的空中 LiDAR 扫描的解析方法。数据集包含 7 个场景,覆盖面积超过 7.7 平方公里,总共 9,800 万个 3D 点。相关论文成果已被 CVPR 2024 接受。

直接使用:https://go.hyper.ai/3pFjm

4. Harvard-GF3300 视网膜神经疾病(青光眼)数据集

该数据集是一个包括 3,300 名受试者的视网膜神经疾病(青光眼)数据集,含有 2D 和 3D 图像数据,数据集中包含了来自 3 个主要种族群体(白人、黑人和亚洲人)相等数量的受试者,这避免了可能混淆公平学习问题的数据不平衡问题。

直接使用:https://go.hyper.ai/vIhu6

5. Dental X-ray Images for Analysis 牙科 X 射线图像数据集

该数据集包含各种各样的牙齿正畸断层扫描 (OPG) X 射线图像,70 个高质量样本。通过提供注释,此数据集可用于训练和测试机器学习模型,以进行牙齿类型分类、异常检测等牙科图像分析任务。

直接使用:https://go.hyper.ai/vK9zz

6. 多区域骨折 X 射线数据集

该数据集包含骨折和非骨折的 X 射线图像,涵盖所有解剖身体区域,包括下肢、上肢、腰椎、臀部、膝盖等。数据集分为训练、测试和验证文件夹,共 10,580 张放射图像(X 射线)数据。

直接使用:https://go.hyper.ai/Yk1bA

7. 水果蔬菜图像识别数据集

该数据集包含 10 种水果和 26 种蔬菜的图像,每种类别都分为了训练、测试和验证集,为图像识别任务提供了多样化的集合。

直接使用:https://go.hyper.ai/FdfRK

8. Character Codex 人物角色数据集

该数据集包含来自各种媒体类型和流派的 15,939 个热门角色信息。每个条目都包含有关角色、媒体来源和涉及角色的独特场景的详细信息。

直接使用:https://go.hyper.ai/wf1q1

9. RepLiQA 用于基准测试的可能问答数据集

RepLiQA 是一个包含「上下文-问题-答案」三元组的评估数据集,涵盖了 17 个主题或文档类别,旨在测试大型语言模型 (LLM) 在提供的文档中查找和使用上下文信息的能力。

直接使用:https://go.hyper.ai/ZkSYD

10. CS-Eval 大模型网络安全评测数据集

该数据集覆盖 11 个网络安全大类领域、 42 个子类领域,4,369 多项选择题、判断题、知识抽取题,提供知识型和实战型的综合评估任务,支持用户自主评测,同时为大模型落地网络安全提供参考和启发。

直接使用:https://go.hyper.ai/ziacf

更多公共数据集,请访问:

https://hyper.ai/datasets

公共教程精选

1. Bioclip 生物分类的层次预测 Demo

该教程 Demo 可以对给定的生物图片按科、属、种等进行分类,是 CVPR2024 的最佳学生论文「BioCLIP: A Vision Foundation Model for the Tree of Life」中模型的 Gradio 版本。

在线运行:https://go.hyper.ai/OEWk1
2. InstantStyle 风格一致的图像生成器

InstantStyle 是由小红书的 InstantX 团队开发的一种文本到图像生成框架,实现了风格迁移的同时保持内容的文本可控性。该教程已经为大家搭建好了相关环境,一键克隆即可体验!

在线运行:https://go.hyper.ai/E6GuW

3. 5 秒生成高质量文章,Llama 3-Chinese-Chat Demo 一键启动!

该模型是基于 Meta-Llama-3-8b-Instruct 模型专门针对中文进行微调的中文聊天模型。与原始的 Meta-Llama-3-8b-Instruct 模型相比,显著减少了「中文问题英文回复」以及中英文混合的问题。只需克隆并启动该容器,直接复制生成的 API 地址,即可对模型进行推理体验。

在线运行:https://go.hyper.ai/BLHcM

社区文章精选

1. 最强铁基超导磁体诞生!科学家基于机器学习设计新研究体系,磁场强度超过先前记录 2.7 倍

来自英国和日本的科学家利用机器学习技术,设计了一种将 researcher-driven 与 data-driven 方法相结合的研究体系,成功制造出世界上已知最强的铁基超导磁体。本文是该研究的详细解读和分享。

查看活动详情:https://go.hyper.ai/RxV9x

2. 北大医院副院长李建平:用 AI 解决临床心肌缺血预测的难点、卡点和痛点

在北京智源大会上,北京大学第一医院副院长、心血管研究所所长李建平教授以「临床心肌缺血预测手段及困难」为题,分享了 AI 在冠心病诊断以及临床心肌缺血预测等方面的全新探索与实践。这为冠心病病人的诊断与治疗提供了全新思路,并将目光从心脏拓宽至肾脏,有望让 AI 在临床医学方面发挥出更大的价值。本文是该演讲的详细汇总。

查看完整专访:https://go.hyper.ai/5X9jM

3. 1 亿参数的细胞大模型来了!登 Nature 子刊,清华大学团队发布 scFoundation:对 2 万基因同时建模

清华大学研究团队提出了名为 sc-Foundation 的细胞大模型,该模型基于 5 千万个细胞的基因表达数据进行训练,拥有 1 亿参数,能够同时处理约 2 万个基因。作为基础模型,它在细胞测序深度增强、细胞药物响应预测和细胞扰动预测等多种生物医学下游任务中,表现出卓越的性能提升。本文是该研究的详细解读和分享。

查看完整报道:https://go.hyper.ai/v5i5K

4. AI 从业者怎么做 Science?清华大学 AIR 周浩:从文本生成到蛋白质设计的跨界探索

近日,清华大学智能产业研究院周浩教授以计算机从业者的身份,向大家分享了 AI 人做蛋白质设计遇到的多重挑战,并从数据结构、生成算法、蛋白质预训练 3 个方面讲述了目前蛋白质领域的最新前沿研究。本文对周浩教授的深度分享进行了报道。

查看完整报道:https://go.hyper.ai/PTyAp

热门百科词条精选

1. 缩放定理 Scaling Law

2. 倒数排名融合 RRF

3. 神经辐射场 NeRF

4. 大规模多任务语言理解 MMLU

5. Kolmogorov-Arnold 表示定理

这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:

https://hyper.ai/wiki

B 站直播预告

AIfredo Canziani 是纽约大学计算机科学助理教授、Yann LeCun 的学生。近日,他放出了自己的春季「AI 课程」视频,各章节讲授的知识点包括:离散概率和朴素贝叶斯;感知机和逻辑回归;优化、统计和神经自然语言处理;神经网络分类等。本周超神经电视台将 7×24h 直播该课程。

下表为小编为大家精选的内容预告↓↓↓

日期时间内容
7 月 1 日星期一18:00第 1 部分朴素贝叶斯简介
7 月 2 日星期二18:00第 2 部分朴素贝叶斯分类
7 月 3 日星期三18:00第 3 部分朴素贝叶斯参数估计和拉普拉斯平滑
7 月 4 日星期四18:00第 4 部分二元分类器评估
7 月 5 日星期五18:00第 5 部分多类感知器二元和多类逻辑回归
7 月 6 日星期六18:00第 6 部分优化和梯度上升
7 月 7 日星期日18:00Alfredo Canziani 演讲基于能量的自监督学习

超神经电视台 7×24h 不间断直播,点击即可收获 AI 领域的「电子榨菜」:

http://live.bilibili.com/26483094

一站式追踪人工智能学术顶会:https://hyper.ai/events

以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!

下周再见!

关于 HyperAI超神经 (hyper.ai)

HyperAI超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区, 致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:

  • 为 1300+ 公开数据集提供国内加速下载节点
  • 收录 400+ 经典及流行在线教程
  • 解读 100+ AI4Science 论文案例
  • 支持 500+ 相关词条查询
  • 托管国内首个完整的 Apache TVM 中文文档

访问官网开启学习之旅:

https://hyper.ai/


超神经HyperAI
1.3k 声望8.8k 粉丝