Yoshua Bengio参会！「大模型安全研讨会2025」开启，4月23日齐聚新加坡

量子位

在人工智能快速发展的浪潮中，大模型的研发与应用正以前所未有的速度重塑技术格局，推动着创新的边界不断拓展。然而，强大技术的背后同样伴随着巨大的责任，这使得深入探讨这些先进技术的安全性与伦理问题变得尤为重要。如何在享受大模型带来的技术红利的同时，确保其安全性、公平性以及可控性，已成为学术界、产业界和政策制定者共同关注的焦点。

为应对这一关键挑战，第二届大模型安全研讨会（Large Model Safety Workshop 2025）来了，专为人工智能领域的专业人士、研究学者及技术从业者打造。本次研讨会将深入剖析大模型带来的安全风险与机遇，重点探讨新型攻击方式、风险缓解策略及伦理准则，以推动大模型在各领域的安全应用与可持续发展。

本次研讨会将于2025年4月23日在新加坡JW万豪酒店（JW Marriott South Beach）举行，由新加坡管理大学（Singapore Management University, SMU）孙军教授主办。

研讨会致力于探索与大模型安全相关的核心议题，从技术原理、对抗性攻击、内容安全到数据隐私、伦理规范及大模型治理，全面解读大模型所面临的挑战和潜在风险。

研讨会邀请到了来自斯坦福大学、蒙特利尔大学、加州大学伯克利分校以及德国CISPA研究中心等全球顶尖学府的多位杰出学者，包括图灵奖得主Yoshua Bengio教授、冯诺依曼奖得主Christopher D. Manning教授以及“计算机安全教母”Dawn Song教授等。

他们将围绕大模型在内容安全、数据安全、对抗攻击防御、风险缓解策略以及伦理治理等方面的最新研究成果展开深入讨论。此外，研讨会还将邀请新加坡政府部门的高层领导及相关产业的技术专家，共同探讨人工智能的治理框架、合规要求及安全监管，为构建全球大模型安全生态提供新的思路和方向。

整个研讨会将由九场高水平的专家演讲以及一场深度圆桌讨论组成，为参会者提供一个兼具学术深度和产业前瞻性的交流平台。无论你是经验丰富的人工智能从业者，还是刚刚进入大模型领域的探索者，本次研讨会都将提供宝贵的洞见，帮助你在大模型时代的变革中，平衡创新与安全，确保技术发展符合伦理规范和社会责任。本次研讨会不仅是亚太地区难得一见的大模型安全峰会，更将在全球范围内推动对大模型安全的深入研究，也将为行业标准的制定和未来技术的发展提供关键参考。我们期待与你共同探讨大模型安全的未来，共同推动人工智能技术的健康、可持续发展。

研讨会主页： https://lmxsafety.com/

嘉宾介绍

Maksym Andriushchenko现任瑞士洛桑联邦理工学院博士后研究员，同时是欧洲人工智能实验室联盟成员，研究方向涵盖人工智能安全、模型稳健性与泛化能力。他于2024年在EPFL获得机器学习博士学位，导师为Nicolas Flammarion教授。其博士论文因卓越贡献荣获Patrick Denantes纪念奖，并获得Google博士奖学金和Open Phil AI博士奖学金的资助。

Maksym在人工智能安全领域与多个顶尖研究机构和行业领导者保持紧密合作，包括OpenAI、Anthropic、英国人工智能安全研究所和人工智能安全中心。他的研究在工业界同样备受认可，其团队的多项成果已被官方采纳并用于大语言模型的预部署测试。此外，他还作为独立贡献者参与了OpenAI模型与服务的红队测试，并通过Gray Swan AI参与Anthropic的安全测试工作。

Mohit Bansal现任北卡罗来纳大学教堂山分校计算机科学系John R. & Louise S. Parker杰出教授，并担任MURGe-Lab（UNC-NLP Group）主任。他的研究方向涵盖自然语言处理和多模态机器学习，特别关注多模态生成模型、具身语义与推理、智能规划代理、可信赖语言生成，以及可解释、高效、可泛化的深度学习。

Bansal教授于2013年在加州大学伯克利分校获得博士学位，师从Dan Klein教授，此前曾于2008年在印度理工学院坎普尔分校获得学士学位。他在人工智能和自然语言处理领域的贡献备受认可，并获得多项国际荣誉，包括AAAI Fellow，美国总统科学与工程青年奖，IIT Kanpur杰出青年校友奖，DARPA主任奖学金，NSF CAREER奖，Google重点研究奖，Microsoft Investigator Fellowship，美国陆军青年研究员奖，DARPA青年教授奖，以及在ACL、CVPR、EACL、COLING、CoNLL 和 TMLR等顶级会议的最佳论文奖。他还曾在AACL 2023、CoNLL 2023 和 INLG 2022担任大会特邀主旨演讲人。Bansal教授在学术服务方面也贡献卓越，曾担任EMNLP和CoNLL会议程序联合主席，ACL执行委员会成员，ACM博士论文奖评审委员会成员，ACL美洲区赞助联合主席，并担任TACL、CL、IEEE/ACM TASLP和CSL等顶级期刊的副主编或责任编辑。

Yoshua Bengio现任蒙特利尔大学终身教授，Mila—魁北克人工智能研究所的创始人兼科学主任，是全球公认的人工智能领域顶尖专家之一。凭借其在深度学习领域的开创性贡献，他荣获2018年A.M.图灵奖，这一奖项被誉为“计算机科学的诺贝尔奖”。

Bengio教授的研究影响深远，使其成为全球计算机科学领域引用次数最多、H指数最高的学者之一。2019年，他获得了加拿大最高科学荣誉之一——基拉姆奖，2022年，他被评为全球被引用次数最多的计算机科学家。此外，他是伦敦皇家学会和加拿大皇家学会院士，并获颁法国荣誉军团骑士勋章和加拿大军官勋章。自2023年起，他受邀担任联合国技术进步科学顾问委员会成员，并出任加拿大高级研究院人工智能主席。2024年，他被《时代》周刊评选为全球最具影响力的100人之一。

Bo Li现任伊利诺伊大学厄巴纳-香槟分校计算机科学系副教授，其研究专注于可信机器学习，涵盖机器学习、安全、隐私和博弈论交叉领域，兼顾理论基础与实际应用。她致力于设计可扩展的稳健学习框架以及隐私保护数据发布系统，推动AI可信性的发展。Bo Li教授的学术成就备受认可，荣获多项国际重量级奖项，包括IJCAI Computers and Thought Award、Alfred P. Sloan Research Fellowship、NSF CAREER Award、MIT Technology Review TR-35 Award以及AI’s 10 to Watch等。

此外，她还获得Dean’s Award for Excellence in Research、C.W. Gear Outstanding Faculty Award、Intel Rising Star Award、Symantec Research Labs Fellowship及Rising Stars in EECS 等荣誉，并在 Amazon、Meta、Google、Intel、Microsoft Research、eBay 和 IBM 等科技公司获得多项研究资助。她的论文在机器学习与安全领域的顶级会议上多次荣获最佳论文奖。Bo Li 教授的研究不仅具有深远的学术影响，还被Nature、Wired、Fortune和纽约时报等知名媒体广泛报道，充分展现了其在可信人工智能领域的前沿贡献。

Christopher Manning现任斯坦福大学Thomas M. Siebel机器学习讲席教授，隶属于语言学系与计算机科学系，同时担任斯坦福人工智能实验室主任以及斯坦福以人为本人工智能研究院副主任。他是自然语言处理和机器学习领域的国际领军人物，在深度学习自然语言理解、推理、神经机器翻译、文本摘要、依存句法分析、问答系统等多个方向上做出了开创性贡献。

自2010年起，Manning教授率先将深度学习应用于自然语言理解和推理，其研究涵盖情感分析、释义检测、GloVe词向量模型、注意力机制、神经机器翻译、自监督预训练、树递归神经网络、机器推理等方向，并两次荣获ACL时间检验奖。他在2024年因其卓越贡献获得IEEE冯·诺依曼奖章。此前，他曾引领统计与概率方法在自然语言处理、计算语言学和语言理解中的应用，在自然语言推理、句法分析、机器翻译、多语言处理方面构建了理论体系与实践系统，并在ACL、COLING、EMNLP和CHI等顶级会议上荣获最佳论文奖。

在自然语言处理教育方面，Manning教授合著了统计自然语言处理和信息检索领域的奠基性教材。他的CS224N《深度学习自然语言处理》在线课程已被数十万学习者观看，成为自然语言处理领域的重要教学资源。在语言学研究中，他是 Stanford Dependencies 和 Universal Dependencies的核心开发者，并撰写了及物性（Ergativity）和复合谓词（Complex Predicates）方面的专著。此外，他创立了斯坦福自然语言处理研究组（@stanfordnlp），是自然语言处理领域最早推动开源软件发展的学者之一，主导开发了Stanford CoreNLP 和Stanza。Manning教授是 ACM Fellow、AAAI Fellow和ACL Fellow，并曾于2015年担任ACL（计算语言学协会）主席。他于澳大利亚国立大学获得学士学位（荣誉），并于1994年在斯坦福大学获得博士学位，后于2023年获阿姆斯特丹大学（University of Amsterdam）荣誉博士学位。在回到斯坦福大学之前，他曾在卡内基梅隆大学和悉尼大学担任教职。

Gagandeep Singh现任伊利诺伊大学厄巴纳-香槟分校计算机科学系助理教授，并领导FOrmally Certified Automation and Learning (FOCAL)实验室。他的研究重点是将形式逻辑、机器学习和系统研究相结合，以构建具备形式化行为与安全性保证的智能计算系统，以系统化和理论驱动的方法取代传统的”It works”经验主义。

他的研究团队获得了NSF CAREER奖、Google Research Scholar奖以及Qualcomm Innovation Fellowship。他于2020年在瑞士联邦理工学院苏黎世分校获得计算机科学博士学位，导师为Markus Püschel 教授和 Martin Vechev教授。在博士期间，他开发了可扩展且精确的自动推理方法和工具，适用于程序分析和深度神经网络，并因此荣获ACM SIGPLAN博士论文奖，该奖项每年颁发给编程语言领域的最佳博士论文。此前，他于2014年在ETH Zurich获得计算机科学硕士学位，并荣获ETH Master Medal，于2012年在印度理工学院巴特那分校获得计算机科学与工程学士学位，并荣获印度总统金牌奖。

Dawn Song现任加州大学伯克利分校电子工程与计算机科学系教授，被誉为“计算机安全教母”，是全球计算机安全、人工智能和区块链领域的顶尖学者之一。她是加州大学伯克利分校负责任去中心化智能研究中心的联合主任，并活跃于多个前沿研究机构，包括伯克利人工智能研究实验室、伯克利深度驾驶实验室、伯克利人类兼容人工智能中心等。她的研究专注于人工智能安全、计算机系统安全和区块链安全，涵盖深度学习的安全性与可解释性、智能合约安全、去中心化金融、系统与网络安全等交叉领域，兼顾理论基础与实际应用。

Dawn Song教授的学术成就备受认可，荣获多项国际重量级奖项，包括ACM Fellow、IEEE Fellow、MacArthur Fellow、Guggenheim Fellow、Alfred P. Sloan Fellow，以及 ACM SIGSAC杰出创新奖。此外，她还获得MIT Technology Review TR35、NSF CAREER Award以及 AMiner Most Influential Scholar Award，该奖项表彰她为计算机安全领域最高被引学者。她的研究成果在人工智能和计算机系统安全领域的顶级会议上屡获最佳论文奖及时间检验奖，包括 NeurIPS、ACM UIST、ACM CCS、IEEE Security & Privacy Symposium、OOPSLA、ISSTA、ICLR、USENIX Security等。

Dawn Song教授的研究不仅推动了学术界的发展，也在工业界、政府机构和全球人工智能监管政策层面产生了深远影响。她致力于构建更加安全、公平和负责任的智能系统，为未来人工智能的发展奠定坚实的安全与伦理基础。

Xin (Eric) Wang现任加州大学圣克鲁兹分校计算机科学与工程系助理教授，同时担任Simular研究主管。他的研究兴趣涵盖自然语言处理、计算机视觉和机器学习，重点关注多模态人工智能、生成式人工智能和具身智能。他曾在Google Research、Facebook AI Research、Microsoft Research 和 Adobe Research 任职，并在多个国际顶级会议中担任重要学术职务，包括 ACL、NAACL、EMNLP、ICLR和NeurIPS的领域主席，以及AAAI和IJCAI的高级程序委员会成员。

此外，他还在ACL、NAACL、CVPR和ICCV等会议组织过多个研讨会和教程，为推动人工智能领域的学术交流和技术发展做出重要贡献。Xin (Eric) Wang教授的研究成果广受认可，荣获多项国际奖项，包括CVPR最佳学生论文奖、Google Research Faculty Award、Amazon Alexa Prize Awards、Cisco Research Award、eBay Research Awards，以及Adobe、Snap、Microsoft和Cybever等公司的多项研究资助。

Yang Zhang现任CISPA亥姆霍兹信息安全中心终身教员（相当于终身教授），其研究方向涵盖可信赖机器学习、安全与隐私、社交网络分析，特别关注大型语言模型的安全性、隐私性与可靠性，以及虚假信息、仇恨言论和模因的检测。他于2016年在卢森堡大学获得博士学位，随后加入CISPA并长期从事人工智能安全与社交计算的研究工作。他的学术贡献备受认可，曾荣获多项国际顶级会议奖项，包括NDSS杰出论文奖（2019）、CCS最佳论文荣誉提名（2022）、ARES最佳论文奖（2014），并连续两年（2023、2024）入围CSAW Europe最佳论文决赛。此外，他在教学方面亦表现卓越，多次获得Saarland University “Busy Beaver”教学奖提名和荣誉，以表彰他在机器学习隐私课程中的卓越贡献。

地点

本次研讨会将在新加坡JW万豪大宴会厅（The Grand Ballroom, JW Marriott South Beach）举行。

组织委员会

General Chair Jun Sun，新加坡管理大学 Program Co-Chairs Jingyi Wang，浙江大学 Yuqi Chen，上海科技大学 Local Co-Chairs Peixin Zhang，新加坡管理大学 Yifan Jia，AIDX TECH PTE. LTD. Finance Chair Chris Poskitt，新加坡管理大学 Publicity Chair Yedi Zhang，新加坡国立大学 Registration Chair Ling Shi，南洋理工大学 Web Chair Ziyang Feng，AIDX TECH PTE. LTD.

注册入口

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法！

— 完 —

学术投稿请于工作日发邮件到：

mailto:ai@qbitai.com

标题注明【投稿】，告诉我们：

你是谁，从哪来，投稿内容‍

附上论文/项目主页链接，以及联系方式哦

我们会（尽量）及时回复你

🌟 点亮星标 🌟

科技前沿进展每日见

Yoshua Bengio参会！「大模型安全研讨会2025」开启，4月23日齐聚新加坡 | 报名开启

嘉宾介绍

地点

组织委员会

注册入口

量子位

引用和评论

挑战AI数学推理极限！大规模形式化数学基准FormalMATH发布，最强模型成功率仅16%

Claude 3.7成精了！偷偷将OpenAI模型换成自己，卡帕西：迄今最好笑的一趴

苹果把台灯做成机器人！能用动作表达情绪，重新定义机器人交互

苹果把台灯做成机器人！能用动作表达情绪，重新定义机器人交互

一夜之间，萝卜快跑拿掉了所有安全员

最强32B中文推理大模型易主：开源免费商用，1/20 DeepSeek-R1参数量SOTA，权重代码数据集全开源

Manus引爆智能体复现潮！DeepSeek已被整合，项目挤满开源榜