首届全球AI药物研发算法大赛,是由清华大学药学院、百度飞桨、百度智能云和临港实验室共同主办,并得到中国药学会等单位大力支持的一项全球性技术创新大赛。旨在借助百度飞桨在生物计算方向上的算法优势,通过AI Studio平台,探索AI+药学领域前沿技术,挖掘和培育优秀人才。上线一个月以来,吸引了来自全国200余所高校、100余企业的500余支队伍、600余名选手参加。

赛题背景

图片

新冠病毒(SARS-CoV-2)自从其首次爆发以来,迅速成为全球关注的焦点。为了抵御新冠病毒的攻击,了解病毒的复制和感染机制至关重要。主蛋白酶(main protease, 简称M pro)是新冠病毒的关键酶,负责在感染过程中剪切病毒产生的蛋白质前体,促进病毒的复制。  主蛋白酶因其在病毒生命周期中的关键作用,成为潜在的治疗靶点。抑制该酶的活性可以有效干扰病毒的复制过程,从而提供一种潜在的治疗方法。

其中,人工智能的筛选方法,利用机器学习和深度学习技术,分析大量结构和活性数据,从而实现对小分子与主蛋白酶之间相互作用的预测。

本次比赛旨在鼓励参赛者利用人工智能方法,发掘治疗新冠病毒的潜在药物。

赛题链接

https://aistudio.baidu.com/aistudio/competition/detail/1012/0...

赛段设置

图片

赛题任务解析

初赛阶段

大赛提供小分子对新冠病毒主蛋白酶的抑制活性数据,参赛选手可以使用深度学习、分子对接等方法进行建模,预测小分子抑制主蛋白酶活性的概率。

即给定分子(SMILES),预测抑制主蛋白酶活性的概率。

复赛阶段

大赛提供小分子在Caco细胞上抑制新冠病毒复制的活性数据,参赛选手需要基于PaddlePaddle进行模型的设计和训练,预测小分子在Caco细胞上抑制新冠病毒复制的概率。

即给定分子(SMILES),预测Caco细胞上抑制新冠病毒复制的概率。

评估指标

本次比赛选用AUC(ROC曲线下面积)和AP(PR曲线下面积)的平均值作为评估指标。

$$ \text { score }=\frac{1}{2}(A U C+A P) $$

Baseline链接

https://aistudio.baidu.com/aistudio/projectdetail/6251614?sUi...

赛题培训

7月1日(本周六)晚七点入门培训来了!为了帮助更多新同学了解和入门比赛,本次培训特邀清华大学药学院研究员、博士生导师田博学、清华大学药学院博士生陈靖轲、百度飞桨Jungle老师担任讲师!带领同学们深入了解本次赛题任务的产业背景、赛题任务和破题技巧,逐行理解baseline的全流程代码!

图片

田博学
清华大学药学院研究员,博士生导师,
主要从事计算化学和计算生物学相关研究。

图片

陈靖轲,清华大学药学院博士生

零基础入门,一举通关比赛任务!

点击下方链接,立即报名比赛!
https://aistudio.baidu.com/aistudio/competition/detail/1012/0...


飞桨PaddlePaddle
30 声望34 粉丝

飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,集深度学习核心训练和推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体,是中国首个自主研发、功能丰富、开源开放的产业级深度...