首届全球AI药物研发算法大赛,是由清华大学药学院、百度飞桨、百度智能云和临港实验室共同主办,并得到中国药学会等单位大力支持的一项全球性技术创新大赛。旨在借助百度飞桨在生物计算方向上的算法优势,通过AI Studio平台,探索AI+药学领域前沿技术,挖掘和培育优秀人才。上线一个月以来,吸引了来自全国200余所高校、100余企业的500余支队伍、600余名选手参加。
赛题背景
新冠病毒(SARS-CoV-2)自从其首次爆发以来,迅速成为全球关注的焦点。为了抵御新冠病毒的攻击,了解病毒的复制和感染机制至关重要。主蛋白酶(main protease, 简称M pro)是新冠病毒的关键酶,负责在感染过程中剪切病毒产生的蛋白质前体,促进病毒的复制。 主蛋白酶因其在病毒生命周期中的关键作用,成为潜在的治疗靶点。抑制该酶的活性可以有效干扰病毒的复制过程,从而提供一种潜在的治疗方法。
其中,人工智能的筛选方法,利用机器学习和深度学习技术,分析大量结构和活性数据,从而实现对小分子与主蛋白酶之间相互作用的预测。
本次比赛旨在鼓励参赛者利用人工智能方法,发掘治疗新冠病毒的潜在药物。
赛题链接
https://aistudio.baidu.com/aistudio/competition/detail/1012/0...
赛段设置
赛题任务解析
初赛阶段
大赛提供小分子对新冠病毒主蛋白酶的抑制活性数据,参赛选手可以使用深度学习、分子对接等方法进行建模,预测小分子抑制主蛋白酶活性的概率。
即给定分子(SMILES),预测抑制主蛋白酶活性的概率。
复赛阶段
大赛提供小分子在Caco细胞上抑制新冠病毒复制的活性数据,参赛选手需要基于PaddlePaddle进行模型的设计和训练,预测小分子在Caco细胞上抑制新冠病毒复制的概率。
即给定分子(SMILES),预测Caco细胞上抑制新冠病毒复制的概率。
评估指标
本次比赛选用AUC(ROC曲线下面积)和AP(PR曲线下面积)的平均值作为评估指标。
$$ \text { score }=\frac{1}{2}(A U C+A P) $$
Baseline链接
https://aistudio.baidu.com/aistudio/projectdetail/6251614?sUi...
赛题培训
7月1日(本周六)晚七点,入门培训来了!为了帮助更多新同学了解和入门比赛,本次培训特邀清华大学药学院研究员、博士生导师田博学、清华大学药学院博士生陈靖轲、百度飞桨Jungle老师担任讲师!带领同学们深入了解本次赛题任务的产业背景、赛题任务和破题技巧,逐行理解baseline的全流程代码!
田博学
清华大学药学院研究员,博士生导师,
主要从事计算化学和计算生物学相关研究。
陈靖轲,清华大学药学院博士生
零基础入门,一举通关比赛任务!
点击下方链接,立即报名比赛!
https://aistudio.baidu.com/aistudio/competition/detail/1012/0...
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。