AI for Science 的新成果、新动态、新视角——
- 全球首家将生物分子凝聚体应用于药物发现的公司,宣布裁减 18 个职位
- 谷歌 DeepMind 发布 AlphaGeometry
- Evaxion Biotech 宣布用 AI 开发定制癌症疫苗
- 讯飞医疗正式递表港交所
- 「重庆大学-百度智能云联合创新中心」成立
详见下文~
企业动态
谷歌 DeepMind 发布 AlphaGeometry
AlphaGeometry 由谷歌 DeepMind 团队和纽约大学的研究人员共同研发,将神经语言模型 (neural language model) 与符号引擎 (symbolic deduction engine) 相结合,能够解决复杂的几何问题,并且水平接近人类。在对 30 道国际奥林匹克数学竞赛 (IMO) 几何题的基准测试中,在给定时间内 AlphaGeometry 解决了其中的 25 道题,之前 SOTA 的「吴方法」解决了 10 道,而人类 IMO 金牌得主平均可以解决 25.9 个问题。
Evaxion Biotech 宣布用 AI 开发定制癌症疫苗
近日,Evaxion Biotech 宣布,通过针对 AI 识别的新型肿瘤抗原(称为内源性逆转录病毒,ERV)开发定制癌症疫苗。消息发出后,Evaxion 的股价大涨,涨幅为 113.43%。Evaxion 成立于 2008 年,是一家致力于构建靶点发现平台的人工智能公司,目前旗下有 3 个人工智能驱动的免疫学平台,分别是 :
- PIONEER:能够以个性化的方式准确有效地识别患者的新抗原靶点,在 24 小时内从 DNA 和 mRNA 测序数据中识别具有免疫原性的新抗原表位。
- EDEN:用于细菌性传染病,可快速识触发细菌传染病的抗原用于疫苗开发。
- RAVEN:可快速识别针对现有、新兴和变异病毒性疾病的候选疫苗,同时触发有效的 B 细胞和 T 细胞反应,针对病毒性疾病的疫苗受到效力减弱和变异病毒逃避的挑战。
AI +生物凝聚物初创公司 Dewpoint Therapeutics 人员重组
作为全球第一家将生物分子凝聚体应用于药物发现的公司,Dewpoint 已经累计融资 2.87 亿美元。但是,成立于 2018 年的 Dewpoint Therapeutics,至今没有一条管线进入临床。由于开发靶向生物分子凝聚体的药物仍然处于萌芽阶段,公司要花费大量的时间和精力进行生物学验证,也导致临床开发进度的缓慢。不久前,公司宣布将裁减 18 个职位,约占员工总数的 15%。
讯飞医疗正式递表港交所,中国医疗人工智能行业中排名第一
据港交所 1 月 26 日披露,讯飞医疗科技股份有限公司递表港交所主板,华泰国际、广发融资 (香港) 与建银国际担任联席保荐人。讯飞医疗成立于 2016 年,其研发的智医助理成功通过了国家执业医师资格考试(综合笔试)。目前,智医助理已覆盖全国 30 多个省份 400 多个区县,提供人工智能辅助诊断建议超过 7.4 亿条、电子病历标准化建议超过 2.8 亿条。
「重庆大学-百度智能云联合创新中心」成立
近日,百度与重庆大学在重庆大学沙坪坝校区签署战略合作协议,并揭牌成立「重庆大学-百度智能云联合创新中心」。据悉,「重庆大学-百度智能云联合创新中心」聚焦山地自动驾驶、大模型应用、信息安全等前沿关键领域,双方将共同打造 AI For Science 科研计算平台,深化产学研结合,推进科技成果双向转化。
政策规范
科技部监督司发布《负责任研究行为规范指引(2023)》
《负责任研究行为规范指引(2023)》在研究选题与实施部分指出:科研人员研究项目的申报材料应真实、准确、客观。不得使用相同或相似研究内容重复申报,未经同意不得将他人列为研究团队成员。不得抄袭、买卖、代写申报材料,不得使用生成式人工智能直接生成申报材料。同时,《指引》还明确规定了:不得直接使用未经核实的由生成式人工智能生成的参考文献。
工具资源
Open Catalyst Project
Open Catalyst Project 是 Meta AI 的基础人工智能研究部门 (FAIR) 和卡内基梅隆大学化学工程系 (CMU) 合作的研究成果,旨在利用 AI 建模并挖掘可用于可再生能源储存的新催化剂,以应对气候变化。
为了使更多研究人员加入 Open Catalyst Project,该团队发布了 Open Catalyst 2020 (OC20) 和 Open Catalyst 2022 (OC22) 数据集,用于训练机器学习模型。数据集共包含 130 万个分子弛豫 (molecular relaxation),以及超过 2.6 亿次 DFT 计算的计算结果。此外,基础模型和代码也一并在 Github 上开源。
开源地址:
https://github.com/Open-Catalyst-Project
Materials Projects
Materials Projects 旨在计算所有无机材料的性质,并免费为每位材料研究人员提供数据和相关的分析算法。该项目的最终目标是,通过把重点放在那些在计算上最有前途的化合物上,从而大大减少研发新材料所需的时间。目前,其可以为研究人员提供:
- Pymatgen:用于材料分析的开源 Python 库,研究人员能够访问 Materials API 进一步分析复杂的材料数据集。
- Crystal Toolkit:开源 Web 应用程序框,用于显示常见的材料数据类型,如晶体结构、能带结构等,专门为 Python 用户设计,允许用户开发完整的网络应用程序,而无需学习传统的网络技术。
- FireWorks:免费开源代码,可以用于自动计算任意计算资源,支持在大型计算中心运行高吞吐量计算。
- Atomate:为执行复杂的材料计算提供了「配方」,只需几行代码就能自动执行一系列相互关联的复杂计算。
官网地址:
https://next-gen.materialsproject.org/
书生·浦语2.0:新一代国产开源大语言模型
1 月 17 日,上海人工智能实验室与商汤科技联合香港中文大学和复旦大学,正式发布新一代大语言模型书⽣·浦语 2.0 (InternLM2),经过 2.6 万亿 token 高质量语料训练,包含 7B 及 20B 两种参数规格,以及基座、对话等版本。在数学推理方面,20B 参数模型在 GSM8K 和 MATH 评测中性能超越 ChatGPT (GPT-3.5)。
开源地址:
https://github.com/InternLM/InternLM
浦科化学:开源科学大模型
1 月 26 日,上海人工智能实验室开源发布首个科学大模型浦科化学 (ChemLLM),通过注入海量化学专业数据,使大模型获得了理解和处理化学相关专业任务的知识与能力。同时,研究人员发现,随着化学能力的获得,大模型的数理学科及推理能力也得到增强。
开源地址:
https://huggingface.co/AI4Chem/ChemLLM-7B-Chat
科研成果
AMIE:基于自博弈的诊断对话大模型
Towards Conversational Diagnostic AI
- 来源:arXiv
- 领域:医疗健康
- 作者:Google Research 和 Google DeepMind
AMIE (Articulate Medical Intelligence Explorer) 使用一种新颖的基于自博弈 (self-play) 的模拟环境,具有自动反馈机制,可在不同的疾病状况、专业和背景下扩展学习。研究人员将 AMIE 的表现与初级保健医生的表现进行了比较,专科医生认为,AMIE 的诊断准确性更高,在 32 个指标中的 28 个指标上表现更佳。
阅读原文:
https://arxiv.org/abs/2401.05654
AlphaFold 发现了数千种可能的致幻剂
AlphaFold2 structures template ligand discovery
- 来源:bioRiv
- 领域:生物医药
- 作者:美国加州大学研究团队
研究人员对 unrefined AF2 模型进行了前瞻性测试,比较了大型文库与 AF2 模型对接的实验命中率和亲和力,以及针对相同受体实验结构的相同筛选结果。AF2 模型针对 5-HT2A 受体进行对接后,研究人员发现了一种更有效、更具选择性的配体的冷冻电镜结构。研究结果表明,AF2 模型可以对与配体发现相关的构象进行采样,从而大大扩展了基于结构的配体发现的适用范围。
阅读原文:
https://www.biorxiv.org/content/10.1101/2023.12.20.572662v1
OptADMET:用于改善铅化合物的 ADMET 特性
OptADMET: a web-based tool for substructure modifications to improve ADMET properties of lead compounds
- 来源:Nature Protocols
- 领域:生物医药
- 作者:浙江大学和中南大学湘雅药学院
OptADMET 是一个线上集成平台,可提供 32 种 ADMET 性质 (absorption, distribution, metabolism, excretion and toxicity) 的化学转化规则,并利用过往实验数据进行先导物优化。同时,OptADMET 还可以提供查询分子中所有优化分子的 ADMET 图谱,可以预测理想的亚结构转换,并对候选药物进行后续验证。
阅读原文:
https://www.nature.com/articles/s41596-023-00942-4
基于图学习的可解释模型
An interpretable model based on graph learning fordiagnosis of Parkinson's disease with voice-related EEG
- 来源:npj Digital Medicine
- 领域:医疗健康
- 作者:中国科学院深圳先进技术研究院和中山大学附属第一医院
研究人员利用帕金森病言语运动任务的异常脑电特征,提出了一种具有可解释性的图信号处理-图卷积网络 (GSP-GCNs) 模型,利用言语基频调控任务脑电数据,通过挖掘帕金森病患者大尺度脑功能网络的神经标记物,实现了帕金森病的高精度智能诊断。
阅读原文:
https://www.nature.com/articles/s41746-023-00983-9
基于 XGBoost 算法的机器学习模型:用于 P-SOC 空气电极的筛选
Machine-Learning Assisted Screening Proton Conducting Co/Fe based Oxide for the Air Electrode of Protonic Solid Oxide Cell
- 来源:Advanced Functional Materials
- 领域:材料化学
- 作者:广州大学
研究团队基于 XGBoost 的机器学习模型,以元素结构为输入,进行 P-SOCs 空气电极的筛选,并基于机器学习预测结果和密度泛函理论 (Density Functional Theory, DFT) 计算,成功筛选出一种用于 P-SOCs 的高效空气电极材料 LCN91,其活化能可与众所周知的空气电极相媲美。
阅读原文:
https://onlinelibrary.wiley.com/doi/10.1002/adfm.202309855
活动预告
第 23 届 Bio-IT World 将于 4 月 15 日开幕
Bio-IT World 将于 2024 年 4 月 15-17 日在波士顿举行,在由数十场会议组成的 10 个分会场中,有 3 个分会场将以人工智能为重点,包括生成式人工智能、人工智能用于药物发现和开发,以及人工智能用于肿瘤学、精准医疗等。
其中,6 场深度专题讨论会还分别涉及 FAIR 数据,知识图谱,量子计算,自动化、数字实验室和机器人技术,数字生物制药,以及临床开发和临床试验的数字化升级。9 场会前研讨会的主题分别是生成式 AI、数据科学、语义管理技术和流程、大型语言模型及其在诺华制药公司的实际应用、制药研发的数字化、生物医学数字孪生等。
报名链接:
https://www.bio-itworldexpo.com/
以上就是「Science AI Weekly」本要分享的所有内容了~
如果你有关于 AI for Science 的最新研究成果、企业一手信息等,欢迎留言「爆料」。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。