SF
Datawhale
Datawhale
注册登录
关注博客
注册登录
主页
关于
RSS
《Happy-LLM》项目正式发布,一起快乐学习大模型!
Datawhale
6 月 1 日
阅读 2 分钟
124
原创 happy-llm Datawhale Datawhale开源 开源贡献:Datawhale happy-llm团队开源初心很多小伙伴在看完《self-llm:开源大模型食用指南》后,感觉意犹未尽,想要深入了解大语言模型的原理和训练过程。于是我们就从去年密谋到现在,决定正式推出一个硬核项目《Happy-LLM》——一个大模型从理论到实践的系统性教程,希望通过...
从零开始200行python代码实现LLM!
Datawhale
5 月 31 日
阅读 7 分钟
343
Datawhale编者荐语:Datawhale干货推荐。以下文章来源于阿里云开发者 ,作者思潜[阿里云开发者 .阿里巴巴官方技术号,关于阿里的技术创新均呈现于此。](#)前言大语言模型(LLM)很火,讨论的文章铺天盖地,但对于没有机器学习背景的人来说,看多了只是粗浅了解了一堆概念,疑惑只增不减。本文尝试从零开始,用python实现...
Text Diffusion,来了!
Datawhale
5 月 30 日
阅读 5 分钟
317
卷友们好,最近Google推出的Gemini Diffusion引起了一波热烈的讨论,其实早在几个月前,就有一个叫Mercury Coder产品展现了Diffusion模型强大的推理能力。学术界也早在2025.02月就成功在8B规模上验证了冷启动训练Diffusion的效果(LLaDA[1])。
RAG 挑战赛冠军方案解析:从数据解析到多路由器检索的工程实践,推荐阅读!
Datawhale
5 月 29 日
阅读 15 分钟
476
Datawhale编者荐语:Datawhale推荐。以下文章来源于ChallengeHub ,作者ChallengeHub[ChallengeHub .由互联网大厂和中科院研究所的算法数分小伙伴们创建,热爱竞赛知识分享,获得过Kaggle、阿里天池等算法竞赛冠亚季成绩。每日给小伙伴带来机器学习、NLP、数据分析知识分享、竞赛干货、职场经验和内推~](#)多路由器 + ...
Llama核心团队大面积跑路:14人中11人出走,Mistral成主要去向!
Datawhale
5 月 28 日
阅读 3 分钟
436
Datawhale Datawhale报道 最新情况:Llama,来源:Founder ParkAI 开源领域的核心玩家 Meta 近期面临的争议不断。在继 Llama 4 模型被爆出实际性能与宣传不符,在测试集上进行训练的「丑闻」之后,Meta 近期又被爆出其 AI 团队的近八成员工已离职。据 businessinsider 报道,Meta 的 AI 团队正面临严峻的人才流失挑战,L...
吴恩达:如何在人工智能领域打造你的职业生涯?
Datawhale
5 月 27 日
阅读 13 分钟
528
Datawhale编者荐语:Datawhale推荐。以下文章来源于腾讯研究院 ,作者吴恩达[腾讯研究院 .腾讯公司设立的社会科学研究机构,依托腾讯公司多元的产品、丰富的案例和海量的数据,围绕产业发展的焦点问题,通过开放合作的研究平台,汇集各界智慧,共同推动互联网产业健康、有序的发展,致力于成为现代科技与社会人文交叉汇...
刚刚,北大校友Lilian Weng自曝公司首个产品?一篇论文未发,估值却已90亿
Datawhale
5 月 26 日
阅读 5 分钟
524
OpenAI前研究员大佬、如今的Thinking Machines Lab联创Lilian Weng,刚刚转发了一个神秘产品——一台专为AI训练打造的「手动调参仪表盘」?
Qwen3-0.6B 能击败 Bert 吗?
Datawhale
5 月 25 日
阅读 5 分钟
617
惧怕滴小白 Datawhale Datawhale干货 作者:惧怕滴小白,编辑:丁师兄大模型作者:惧怕滴小白,知乎:[链接]01Changelog新增 Qwen3-0.6B 在 Ag\_news 数据集 Zero-Shot 的效果。新增 Qwen3-0.6B 线性层分类方法的效果。调整 Bert 训练参数(epoch、eval\_steps),以实现更细致的观察,避免严重过拟合的情况。[25/04/28]...
16岁高中生用AI创造了什么?
Datawhale
5 月 24 日
阅读 5 分钟
615
从《流浪地球》中MOSS的科幻震撼,到为母亲开发智能评语生成器——16岁的陈君航用自己的AI成长路径,诠释了一个朴素真理:“技术真正的魅力,不是惊艳谁,而是真正解决问题的那一刻。”这也正是百度文心大模型的技术初心。
Agent主题百校联动,首场来北大了!
Datawhale
5 月 22 日
阅读 1 分钟
723
原创 走进北大的 Datawhale Datawhale高校 联合主办:Datawhale、扣子空间首站北大:开启Agent技术普及新篇章2025年5月26日,国内规模最大的Agent主题高校活动——“AI+X高校行”首场将在北京大学正式启动。本次活动由Datawhale与字节跳动扣子空间联合主办,聚焦Agent前沿方向,通过通识讲堂、实战工坊和创新赛三大环节,为...
最热Agent方向,高校活动组织者招募了!
Datawhale
5 月 21 日
阅读 1 分钟
346
原创 线下见面的 Datawhale Datawhale高校 Agent主题:AI+X高校联动最热Agent方向,五月百校联动来了今年四月,AI+X 高校行走进了上海交通大学、同济大学、哈尔滨工业大学、中山大学、湖南大学、苏州大学、华中师范大学、太原理工大学、广州大学等 42 所高校。五月到六月,Datawhale将联合扣子空间和 Dify 组织全国最大...
Agent大爆发!微软一晚上发布50个新东西!
Datawhale
5 月 20 日
阅读 6 分钟
680
Datawhale Datawhale分享 最新:微软Build 2025大会编辑:新智元整场2小时发布会,Agent成为了高频词。昨晚,微软Build 2025大会开幕式上,纳德拉再次向全世界宣告——我们正式进入AI智能体时代。五项重大发布,四个全与智能体有关:Coding Agent:GitHub Copilot成为全能编程AI助手,修复bug、代码维护,皆可自主完成。Mi...
75万元奖金池+心动offer,启元实验室2025重磅赛事来袭,三大赛道,等你来战!
Datawhale
5 月 20 日
阅读 2 分钟
624
为推动智能算法从理论创新走向实际落地,启元实验室正式启动「启智杯」算法大赛。本届大赛聚焦「卫星遥感图像鲁棒实例分割」、「面向嵌入式平台的无人机对地目标检测」以及「面向多模态大模型的对抗」三大方向,围绕鲁棒感知、轻量部署与对抗防御等核心能力,旨在引导技术创新精准对接应用场景,加速智能算法的落地转化...
北大DeepSeek论文或预定ACL Best Paper!梁文锋署名
Datawhale
5 月 19 日
阅读 6 分钟
644
Datawhale Datawhale分享 最新:ACL 2025,编辑:新智元重磅惊喜!北大与DeepSeek合作,并由梁文锋亲自提交到arXiv的论文,将有望斩获ACL 2025最佳论文(ACL Best Paper)。论文地址:[链接]要知道今年的ACL格外的卷,总投稿数高达8000多篇,创历史之最,而ACL 2024总投稿数仅为4407,几乎翻倍!原生稀疏注意力(Native ...
最新!2025 中国 ESI 大学排名(496 所)
Datawhale
5 月 18 日
阅读 2 分钟
829
Datawhale Datawhale分享 最新:2025 中国 ESI 大学排名编辑|双一流高教5月8日,科睿唯安公布了基本科学指标数据库(Essential Science Indicators,简称ESI)最新统计数据。根据这次ESI数据,中国大陆文章发表545万篇排名全球第一,文章被引9236万次排名全球第二,文章篇均被引16.95次。ESI是基本科学指标数据库,用于...
刚刚,OpenAI最强编程智能体上线ChatGPT
Datawhale
5 月 17 日
阅读 4 分钟
682
Datawhale Datawhale热点 最新发布:OpenAI,整理:Datawhale编辑|新智元从今天起,AI编程正式开启新时代!刚刚,Greg Brockman带队与OpenAI六人团队开启线上直播,震撼发布了一款云端AI编程智能体——Codex。用奥特曼的话来说就是,一个人就能打造无数软件的时代来了!Codex由新模型codex-1加持,这是o3的一个特调版本,...
不用等了!吴恩达MCP课程来了!
Datawhale
5 月 16 日
阅读 2 分钟
720
Datawhale Datawhale干货 最新:MCP课程,整理:Datawhale来源|X、Deep Learning.ai、AI寒武纪为什么 MCP 这么火MCP 是一种开放的技术协议,旨在标准化大型语言模型(LLM)与外部工具和服务的交互方式。你可以把 MCP 理解成像是一个 AI 世界的通用翻译官,让 AI 模型能够与各种各样的外部工具"对话"。而在 MCP 出现之前...
新增学习内容:基于MCP的AI Agent应用开发!
Datawhale
5 月 15 日
阅读 1 分钟
660
原创 面向企业级应用的 Datawhale Datawhale发布 内容更新:Datawhale AI春训营Datawhale AI春训营最后一期,由Datawhale联合上海科学智能研究院、科大讯飞、阿里云百炼等国内头部产学研机构共同主办。**新增阿里云百炼和Datawhale的联合项目,聚焦基于MCP的AI Agent应用开发,面向在职、对企业级应用感兴趣的同学。Data...
LeCun转发!纽约大学100页机器学习讲义公开:所有人都在追LLM,高校为何死磕基础理论?
Datawhale
5 月 14 日
阅读 5 分钟
748
最近,Meta 公司首席 AI 科学家、图灵奖得主 LeCun 转发了他在纽约大学的同事 Kyunghyun Cho 的一篇帖子:内容是关于这位教授 2025 学年机器学习研究生课程的教学大纲和讲义。
最后一期春训营,AI算法/大模型通通都有!
Datawhale
5 月 13 日
阅读 1 分钟
637
原创 一起学习的 Datawhale Datawhale学习 2025 AI春训营第三期最后一期,涵盖AI算法/大模型方向2025年最后一期AI春训营,由Datawhale联合上海科学智能研究院、科大讯飞等国内头部产学研机构共同主办,涵盖AI算法和大模型方向的三个赛事实践项目。**通俗理解三个赛事实践01第三届世界科学智能大赛(AI+新能源)02第三届...
AI本科毕业前的年度总结!从FPS游戏到AI大模型
Datawhale
5 月 12 日
阅读 5 分钟
566
原创 Nagi-ovo Datawhale Datawhale干货 作者:Nagi-ovo,Datawhale开源贡献者2024 是我接触深度学习的第一年,也是进入大模型领域的第一年,也许未来某天回头看,今年会是做出众多重要选择的一年。先上一下 Coding 的年度总结:坐标北京普通 211 人工智能专业,前两年专攻 FPS 游戏段位,后面对前端开发兴趣浓厚,从 JS...
最后一期实习绿通和奖学金!面向本科生、研究生的 AI 春训营来了!
Datawhale
5 月 11 日
阅读 1 分钟
1.1k
原创 春季学习的 Datawhale无论你是新手还是有AI基础只要你对AI方向感兴趣,有热情欢迎你加入Datawhale AI 春训营面向在校学生、在职学习者提供实践与就业绿通机会最后一期正式开放报名线上活动,全程免费报名时间:2025/5/11 - 2025/5/171关于AI春训营Datawhale AI春训营是聚焦真实行业需求,面向未来培养就业能力的春...
毕设季算力支援计划,一杯奶茶钱搞定!
Datawhale
5 月 10 日
阅读 1 分钟
1.1k
Datawhale Datawhale算力 联合发起:GpuGeek、Datahwhale五月进入毕设季,大家对于算力的需求显著提高:实验室显卡争抢激烈、个人电脑跑不动大模型、云服务器租用成本高到肉疼……GpuGeek联合Datawhale推出 “毕设季算力支援计划”,A5000显卡价格直降至0.88元/小时,叠加 150元学生算力券,一杯奶茶钱就能跑完整个毕设模型...
五月组队学习计划!
Datawhale
5 月 9 日
阅读 3 分钟
1.1k
原创 一起学习的 Datawhale Datawhale学习 开源贡献:Datawhale团队什么是组队学习?组队学习活动,于2018年8月2日,由Datawhale发起,已经坚持组织了六年。初衷很简单,就是一群志同道合的小伙伴,一起学习讨论,一起克服拖延,一起组队打boss。没有老师,没有教学,有的是一群热爱学习和渴望改变的人,交流学习,互促...
通义灵码新增智能体+MCP!个人免费用!
Datawhale
5 月 8 日
阅读 5 分钟
1.5k
Datawhale Datawhale干货 最新:AI编程助手,通义灵码近期,通义灵码全新升级:阿里云发布国内首个支持「自主决策+工具链闭环」的编程智能体,面向个人免费!网址:[链接]【最新黑科技功能】1️⃣ 通义灵码新增智能体模式,具备自主决策、环境感知、工具使用等能力。2️⃣ 支持国内首个混合推理模型 Qwen3。3️⃣ 全面支持 MCP...
本地部署大模型实现扫描版PDF文件OCR 识别,笔记本可跑
Datawhale
5 月 7 日
阅读 4 分钟
1.6k
Datawhale编者荐语:Datawhale干货推荐。以下文章来源于机器学习与数学 ,作者大师兄[机器学习与数学 .人工智能算法技术与前沿资讯的深度解读与最新动态。](#)在使用大模型处理书籍 PDF 时,有时你会遇到扫描版 PDF,也就是说每一页其实是图像形式。这时,大模型需要先从图片中提取文本,而这就需要借助 OCR(光学字符识...
第二期新增学习内容:Agent开发!
Datawhale
5 月 5 日
阅读 1 分钟
1.3k
Datawhale AI春训营是聚焦真实行业需求,面向未来培养就业能力的春季AI集训活动,旨在汇聚产学研资源和开源社区力量,为学习者提供AI项目实践与就业机会。
快手二面拷打:训练100B模型要多少显存?
Datawhale
5 月 4 日
阅读 7 分钟
1.4k
kaiyuan Datawhale Datawhale干货 作者:kaiyuan,来源:知乎Author: kaiyuanLink: [链接]编辑: 丁师兄大模型AI 算法在服务器中运行时,一个常见问题“单张 GPU 能承载多少模型参数?”,该问题跟模型结构、引擎框架、驱动版本、GPU 硬件相关。本文围绕大模型的训练/推理场景,介绍 Transformer 类模型的显存计算公式,帮...
从高校到产业:Datawhale的AI大事件!
Datawhale
5 月 4 日
阅读 4 分钟
1.4k
四月的 Datawhale点击蓝字,关注DatawhaleDatawhale01Datawhale 纪事:活动篇AI+X 高校行高校联动,举办 Use-AI 主题线下活动:让每个人都能用得会 AI4月 10 日至 25 日,AI+X 高校行在全国 29 个城市 40 多所高校成功举办,覆盖上海交通大学、同济大学、中山大学、湖南大学等众多院校。Datawhale 联合上海科学智能研究...
小白逆袭指南:半小时搞定世界顶级AI大赛(新能源赛道)
Datawhale
5 月 2 日
阅读 3 分钟
1.4k
原创 保姆式引导学习的 Datawhale Datawhale发布 保姆教程:世界科学智能大赛,AI赛事已举办三届,世界顶级AI大赛第三届世界科学智能大赛是由上海科学智能研究院与复旦大学联合主办,上海市科学技术委员会、上海市发展和改革委员会、上海市经济和信息化委员会、上海市教育委员会等多部门联合指导的全球性顶级AI赛事。该...
1
(current)
2
3
4
5
…
More
下一页
1
(current)
下一页