用LLM做文本分类,微调选base还是chat

1 月 12 日
阅读 22 分钟
509
Datawhale编者荐语:Datawhale推荐以下文章来源于包包算法笔记 ,作者LeonYi[包包算法笔记 .大模型技术和行业认知](#)作者:LeonYi 链接:https://www.zhihu.com/question/632473480/answer/75664255663使用Qwen2ForSequenceClassification实现文本分类任务。一、实验结果和结论这几个月,在大模型分类场景做了很多实验...

25年美科技大裁员,微软开场!

1 月 11 日
阅读 5 分钟
390
Datawhale Datawhale分享 最近:微软,来源:新智元去年12月,OpenAI公布了o3在代码方面的巨大进步。有CS毕业生感觉专业白学了:找到对口工作的CS毕业生,可能还在庆幸,毕竟o3还只对安全研究员开放,没有进入市场,而且性价比可能也比较低。但这次「狼」真的来了!美国职场「寒冬」在OpenAI公布新AI模型o3之前,云计算...

2025第一场组队学习来了!

1 月 10 日
阅读 2 分钟
426
原创 一起学习的 Datawhale Datawhale学习 开源贡献:Datawhale团队什么是组队学习?组队学习活动,于2018年8月2日,由Datawhale发起,已经坚持组织了六年。初衷很简单,就是一群志同道合的小伙伴,一起学习讨论,一起克服拖延,一起组队打boss。没有老师,没有教学,有的是一群热爱学习和渴望改变的人,交流学习,互促...

突发!美国拟(全面禁止)向中国出口 AI 芯片

1 月 9 日
阅读 2 分钟
300
Datawhale Datawhale分享 美国:AI 芯片,来源:云头条2025 年 1 月 9 日,拜登政府计划在离任前夕对英伟达等公司的 AI 芯片出口实施新一轮限制。据悉,新规可能最早于周五发布,并将设立三个层级(Tier 1,Tier 2,Tier 3)的芯片限制措施。Tier 1的美国少数盟友,可以不受限制地获取美国芯片Tier 2的国家和地区,将面...

无需采购GPU,1小时内轻松完成100个微调模型部署,按量计费每月立省10万!

1 月 8 日
阅读 3 分钟
286
Datawhale Datawhale方案 团队:无问芯穹大模型服务平台多个业务微调模型部署,面临成本和管理复杂的挑战现如今,LoRA 微调技术已经成为许多公司提高模型性能的重要方法。实验表明,针对特定任务进行 LoRA 微调,尤其是在开源基础模型上,可以显著超越像 GPT-4 等闭源模型的效果。越来越多的企业开始采用 LoRA 微调技术...

最新AI Agent万字综述分享!

1 月 7 日
阅读 11 分钟
452
原创 王月凡 Datawhale Datawhale干货 分享:王月凡,支付宝百宝箱团队近日,支付宝百宝箱团队的技术负责人王月凡在 Datawhale 社区带来了 AI Agent 综述分享。从大语言模型的发展历程出发,全面分享了AI Agent现状,包括:AI Agent 出现的原因、构成、核心技术、核心能力、应用场景,以及备受关注的场景落地难点。同时...

2025.1.5,段永平和浙大师生的交流内容

1 月 5 日
阅读 2 分钟
144
Datawhale Datawhale干货 分享:段永平,编辑:凤凰学社2025年1月5日,浙大迎来了杰出校友段永平的特别见面会。这位享誉中外的企业家、投资家,再次回到母校,与学子们分享他的洞见与智慧。段永平不仅以其卓越的商业成就和投资眼光闻名,还通过他的人生哲学和价值观,深刻影响了一代创业者与投资人。段永平的传奇故事段...

联手OpenAI,吴恩达推出一门o1推理新课程,还免费!

1 月 4 日
阅读 2 分钟
142
通过在推理时执行思维链推理,o 系列模型在新兴用例中表现出色,包括多步骤规划、图像推理和长期编码。那么,具体如何使用 o 系列模型来构建需要复杂推理的应用程序呢?

高校首发“AI禁令”

1 月 3 日
阅读 3 分钟
116
Datawhale Datawhale高校 来源:中国大学生在线期末已至在高校读书的同学们正忙着完成各种论文、报告很多学生会选择利用AI来当帮手相比翻阅厚重的书籍资料或者利用互联网搜索引擎查找资料借助AI完成作业更加方便、实用但也出现了滥用AI的情况5分钟生成一篇结课论文10分钟做完一个PPT报告上交的作业充满AI味儿老师头疼不...

233万奖金的顶级大赛来了!

1 月 2 日
阅读 2 分钟
183
Datawhale Datawhale大赛 主办方:深圳市科技创新局、鹏城实验室参与一场权威可信、多维激励、高水平竞技的人工智能赛事,既是实践加分、技能验证的好机会,也是促学促用、广交同好的极佳方式。第五届全国人工智能大赛,就是近期最值得参与、尝试的顶级赛事之一。大赛由深圳市科技创新局、鹏城实验室主办,新一代人工智...

成功!在26年前老年机跑大模型!

1 月 1 日
阅读 6 分钟
137
让 Llama 2 在 Windows 98 奔腾 2(Pentium II)机器上运行,不但成功了,输出达到 39.31 tok / 秒。

2024结束,奥特曼公布2025 OpenAI目标!

2024-12-31
阅读 2 分钟
134
Datawhale Datawhale分享 OpenAI:2025目标,来源:量子位狂奔的2024年进入最后一天,奥特曼2025目标来了~坏消息:没有GPT-5,开源依旧不在考虑范围内……前几日奥特曼发帖子收集大伙儿愿望,引得420万网友围观,评论区留下1万个心愿单。你希望OpenAI在2025年开发/修复什么?就在刚刚,参考大家建议后,OpenAI 2025目标公...

「人人皆是开发者」的大模型时代来了,5大开发者利器

2024-12-30
阅读 4 分钟
133
原创 Datawhale Datawhale Datawhale干货 AI利器:大模型开发者2024年,注定被写进 AI 发展的历史篇章。 就在它马上就要结束的时候—— 「人人皆是开发者」的大模型时代,正在拉开序幕。 在大模型的浪潮席卷全球之际,Datawhale 作为常年和开发者打交道的 AI 社区,有幸第一时间体验了 火山引擎 Force 原动力大会上发布...

我与vLLM的2024:清华大佬的vLLM开发之路

2024-12-29
阅读 6 分钟
202
游凯超 Datawhale Datawhale推荐 作者:游凯超,清华软院博士研究生楔子我与 vLLM 的缘分,还得从五年前的那个暑假说起。2019 年,我在UC Berkeley的RISELab跟随Michael Jordan教授进行暑期研修。某天,我偶然遇到一位新入学的博士生,厚着脸皮加了他的微信。当时的我怎么也不会想到,这一“社交冒险”会在五年后改变我的...

雷军挖了个95后AI天才少女,开出千万年薪!

2024-12-28
阅读 2 分钟
191
Datawhale Datawhale分享 小米:95后天才少女,罗福莉来源:51CTO官微、科技每日推送、第一财经雷军,亲自挖人了。知情人士称,雷军认为小米在大模型领域发力太晚,于是亲自挖人,重金招募能够领军小米大模型的人才。而且雷总已经初战告捷——帮小米赢得了 DeepSeek 的关键骨干罗福莉。据报道,作为95后的 AI 天才少女或将...

突发!OpenAI官宣成为盈利性公司

2024-12-27
阅读 3 分钟
214
就在刚刚,OpenAI 正式宣布,OpenAI将转型为公共利益公司(public benefit corporation),将会采用更为传统的公司架构。

Datawhale成员上榜!

2024-12-26
阅读 1 分钟
130
DatawhaleDatawhale多位成员荣获2024年度影响力新书奖获奖成员:长琴、黄玉琳、易华挥、王琦、杨毅远、江季获奖书籍《ChatGPT原理与应用开发》一本教你基于大语言进行商业应用开发的书!本书主要介绍基于ChatGPT 开发算法相关的应用或服务,侧重于介绍与自然语言处理相关的常见任务和应用,以及如何使用类似ChatGPT 的大...

Nature发布,AI 全球100强!

2024-12-25
阅读 1 分钟
146
最近,“Nature Index Supplements 2024 AI”发布了全球AI研究领域领先的TOP100高校榜单,作为申请AI相关专业的学生,这份榜单值得认真参考。

送给关注Datawhale的学习者:背后总结的AI学习法

2024-12-24
阅读 1 分钟
131
2025 AI冬令营,第一期共吸引了 10801 名学习者参与,覆盖了全球 1095 所高校,613 家企业,学习教程总访问量 28469 次,提交学习笔记人数超 1600 人,诞生 121 份作品。背后的学习方法是怎样的?

提供实习证明和奖学金!面向大学生、在职的 AI 冬令营来了!

2024-12-23
阅读 1 分钟
133
原创 Datawhale Datawhale无论你是新手还是有AI基础 只要你对AI应用感兴趣,有热情欢迎你加入Datawhale AI 冬令营面向在校学生、在职学习者提供冬季线上学习机会第二期正式开放报名线上活动,全程免费报名时间:2024/12/22 - 2024/12/281关于AI冬令营Datawhale AI冬令营是一个在冬季举办的大规模AI学习活动,旨在汇聚产...

Datawhale 2025 AI 冬令营第二期来了!

2024-12-22
阅读 1 分钟
116
2025 AI冬令营,第一期共吸引了 10801 名学习者参与。其中直接参与Datawhale夏令营的有 4840 人,覆盖了全球 1088 所高校,613 家企业。另有 7 所高校作为联合组织方,基于冬令营内容授权进行学习,共有 5961 名学习者参与。

Anthropic最新:AI Agents 2024年度总结!

2024-12-21
阅读 6 分钟
165
2025年将是Agentic系统之年。一切正在就位:Computer Use、MCP(模型上下文协议)、改进的工具使用。是时候开始考虑构建这些系统了。

Datawhale宣传团队招募成员!

2024-12-20
阅读 1 分钟
134
Datawhale(datawhale.cn)是国内头部的 AI 开源学习组织,Github 全球排名 Top 100,汇集了众多领域院校和知名企业的优秀学习者,聚合了一群有开源精神和探索精神的团队成员。

大模型微调(Fine-Tuning)全流程思考

2024-12-19
阅读 4 分钟
657
原创 August Datawhale Datawhale分享 作者:August大模型微调的过程💡建议严格按照此流程来,不要跳步,不然可能会做无用功。 比如如果没有好好构建数据集,最后发现微调模型效果不佳是数据集的问题,就事倍功半了。 方案的构思与落地:几种可能的选择我有个问题,我现在写了一个prompt,用户可以自己输入内容,但我不...

一篇AI冬令营第一期的优秀学习笔记!

2024-12-18
阅读 4 分钟
162
Datawhale Datawhale冬令营 学习:Task01,作者:Reacal\_子轩前言大模型是指具有大规模参数和复杂计算结构的机器学习模型。它们通常拥有数百万到数十亿的参数,需要大量的数据和计算资源进行训练和推理。大模型在深度学习领域中占据重要地位,能够处理复杂的任务,如自然语言处理、计算机视觉和语音识别等。 了解如何...

Meta最新研究:无需Tokenizer的架构!

2024-12-17
阅读 5 分钟
101
Datawhale Datawhale分享 最新:Meta,编辑:机器之心BLT 在许多基准测试中超越了基于 token 的架构。最近几天,来自 Meta 、芝加哥大学等机构的合著论文《 Byte Latent Transformer: Patches Scale Better Than Tokens 》火了,在 Hacker News 上受到广泛讨论。有人表示,非常期待这项研究取得成功,这样就可以和 token...

Datawhale和年轻人的学术酒吧

2024-12-16
阅读 2 分钟
114
原创 zzm,大黄 Datawhale Datawhale线下 发起人:zzm,大黄,地点:杭州【发起人】zzm,Datawhale 成员大黄,Datawhale 鲸英助教【缘由】zzm 在Datawhale进行交流的过程中,发现了大家都非常渴望与不同学校、不同职业的外界的人进行链接,但是没有一个轻松的机会能让大家放心大胆的社交。因此 zzm 和大黄专门策划举办了...

哗然!MIT教授NeurIPS演讲公开歧视中国学生,大会官方认错、本人道歉

2024-12-15
阅读 4 分钟
124
机器之心 Datawhale Datawhale分享 编辑:机器之心正在加拿大温哥华举办的人工智能顶会 NeurIPS,竟然有学者在演讲中公开发表对中国学者的歧视言论。「我这样做是为了让我的论文结果看上去更好,我的学校里没有人教我们道德或价值观。—— 现在已被顶尖大学开除的中国留学生的借口。注:我认识的大多数中国人都是诚实正直...

ACM杰出科学家王晓峰教授招收25/26 Fall PhD、科研实习生

2024-12-14
阅读 1 分钟
163
美国印第安纳大学王晓峰教授,是计算机安全领域最知名学者之一,同时也是 IEEE Fellow、ACM Fellow 及 AAAS Fellow 获得者,担任 ACM SIGSAC 主席。个人在计算机安全 CS ranking 方向排名世界第一,在安全四大顶级会议上的论文发表数量同样居于世界首位。

悼念!《数据结构》编著者、清华大学计算机教授严蔚敏去世,享年 86 岁

2024-12-13
阅读 2 分钟
165
Datawhale Datawhale分享 悼念:严蔚敏教授,来源:CSDNDatawhale的读者,可能很多人都学过她的教材。近日,学术界传来一则令人沉痛的消息:清华大学计算机教授、《数据结构》编著者严蔚敏去世,享年 86 岁。她的离去,让无数学子和同行感到深深的哀痛和不舍。1938 年 4 月出生的严蔚敏教授,长期致力于数据结构的教学与...