顶尖学术盛宴,CADD计算机辅助药物设计联合AIDD人工智能药物发现与深度学习基因组学

 CADD(Computer Aided Drug Design):计算机辅助药物设计,依据生物化学、酶学、分子生物学以及遗传学等生命科学的研究成果,针对这些基础研究中所揭示的包括酶、受体、离子通道及核酸等潜在的药物设计靶点,并参考其它类源性配体或天然产物的化学结构特征,以计算机化学为基础,通过计算机的模拟、计算和预算药物与受体生物大分子之间的相互作用,考察药物与靶点的结构互补、性质互补等,设计出合理的药物分子。它是设计和优化先导化合物的方法,特别是在食品、生物、化学、医药、植物、疾病方面应用广泛!

         AIDD(AI Drug Discovery & Design):是近年来非常火热的技术应用,且已经介入到新药设计到研发的大部分环节当中,为新药发现与开发带来了极大的助力。倾向于机器对数据库信息的自我学习,可以对数据进行提取和学习,一定程度上避免了化合物设计过程中的试错路径,同时还会带来很多全新的结构,为药物发现打破常规的结构壁垒。覆盖了机器学习和深度学习,能与新药研发相结合并实质性的应用到靶点预测、高通量筛选、药物设计、药物的ADMET性质预测等;且算力方面,由早期应用于药物发现领域的决策树、随机向量机等机器学习模型,进展到深度神经网络、卷积神经网络、循环神经网络等深度学习算法。具体到新药研发环节:如靶点识别,基于决策树来预测与疾病相关的基因,有研究者发现了多种EF在信号通路和胞外定位中的调控作用,并进一步基于靶点的结构和几何特征,选取一定量蛋白的数十个结合位点以及大量的非药物结合位点,构建随机森林分类器来预测药物靶点,并有研究者进一步采样提升了随机森林算法,成功的从非药物靶点中区分了药物靶点。再如,活性筛选方面,AIDD可以对候选化合物进行筛选,从而更快的筛选出作用于特定靶点且具有较高活性的化合物.

      基因组学(genomics)是对生物体所有基因进行集体表征、定量研究及不同基因组比较研究的一门交叉生物学学科,基因组学的目的是对一个生物体所有基因进行集体表征和量化,并研究它们之间的相互关系及对生物体的影响 。机器学习已经被广泛应用于基因组学研究中,利用已知的训练集对数据的类型和应答结果进行预测,深度学习,可以进行预测和降维分析。深度学习模型的能力更强且更灵活,在适当的训练数据下,深度学习可以在较少人工参与的情况下自动学习特征和规律。调控基因组学,变异检测,致病性评分成功应用。深度学习可以提高基因组数据的可解释性,并将基因组数据转化为可操作的临床信息。改善疾病诊断方案,了解应该使用哪些药物和给谁服用药物,最大限度的减少副作用,最大限度的提高疗效,所有这些都要求从基因组原始数据开始进行分析。这将是一项非常耗时的过程,因为涉及到的变量太多了,而深度学习恰恰能帮助缩短这 一过程,进两年国内外顶尖课题组MIT、Harvard University、UPenn、清华大学、复旦大学等都在从事深度学习基因组学的研究,这一研究成果更是多次发表在Nature Reviews Genetics、Nature Methods、Science Advances、Cancer Cell、Nature Biotechnology 等知名国际顶刊上,为我们发表顶刊鉴定了基础!

      由于国内计算机辅助药物设计与人工智能药物发现与设计和深度学习基因组学研究发展缓慢,学习平台文献资料较少,培训学习迫在眉睫, 应广大科研人员要求,本单位经过数月调研,决定联合专家共同举办“CADD计算机辅助药物设计+AIDD人工智能药物发现与设计+深度学习在基因组学”专题培训班,本单位已经举办九期培训,参会人员800余人,对于培训安排和培训质量一致评价极高 !

培训对象

全国各大高校、企业、科研院所从事人工智能、生命科学、代谢工程、有机合成、抗体工程、酶工程、天然产物、蛋白质、药物、生物信息学、植物学,动物学、食品、化学化工,医学、疾病、机器学习、基因组学、农业科学、植物学、动物学,临床医学、食品科学与工程、植物基因组、动物传染病、肿瘤免疫与靶向治疗、 全基因组泛癌分析、人黏连蛋白折叠基因组机、有机合成、生物化学、病毒检测、高通量测序、分子生物学、功能基因组、遗传图谱、基因挖掘变异、代谢组学、蛋白质组学、转录组学、生物医学、转化研究、蛋白质、癌症、核酸、毒物学研究、生物信息、生物计算、生命科学、生态、肿瘤、遗传、基因改造、细胞分化、微生物、生物医学大数据分析与挖掘、数学类专业、计算机科学、医学、疾病等研究的科研人员以及人工智能爱好者

培训目标(完全适合零基础)

      CADD计算机辅助药物设计设计流程,让学员能够掌握包括PDB数据库、靶点蛋白、蛋白质-配体、蛋白-配体小分子、蛋白-配体结构、notepad的介绍和使用、分子对接、蛋白-配体对接、虚拟筛选、蛋白-蛋白对接、蛋白-多糖分子对接、蛋白-水合对接、Linux安装、gromacs分子动力学全程实操、溶剂化分子动力学模拟

      AIDD人工智能药物发现与设计流程,让学员能够掌握包括配体人工智能药物发现(AIDD)简介、基于结构的药物发现与设计、基于配体的药物发现与设计、常用工具的介绍与安装(Anaconda3、Pandas、NumPy、RDKit、scikit-learn、Pytorch、Tensorflow、DeepChem)基于配体结构的药物发现——分类任务、模型评估方法、分类模型的常用评价指标、变量筛选、参数格点搜索、基于配体结构的药物发现——回归任务、深度学习与药物发现、分子生成模型

     深度学习基因组学设计流程:深入学习与了解深度学习基本框架与逻辑,同时掌握基本的生物信息学软件(Linux、R、python等)的使用,让学员能更好的应对基因组数据,挖掘出超越已有知识的新知识。而构建好的深度学习模型去探求新的研究思路和寻找新的潜在生物学机制,更好的服务于自身的科学研究和探索的过程中。同时,学习已经发表的高分文章结构和数据,掌握深度学习和基因组学之间的关联关系和分析思路及方法技巧,在多组学数据的基础上,熟练应用深度学习算法和应用,让学员能够在学习理论知识的同时熟悉代码实操,帮助科研工作者利用已有公共数据库挖掘数据,独自完成自己的课题研究项目,发表高分文献

培训讲师

主讲老师来自国内高校、中科院等单位,老师主要擅长深度学习、机器学习、药物虚拟筛选、计算机辅助药物设计、人工智能药物发现、分子对接、分子动力学等方面的研究,在我们单位长期进行授课,讲课内容和授课方式以及敬业精神受到参会学员 的一致认可和高度评价

基因组学主讲老师来自国内高校陈老师授课。在国内外学术刊物发表论文数篇,包括Nature Communication, Cell Regeneration等知名期刊,研究方向为生物信息学,发育生物学和遗传学等。利用多组学数据,通过深度学习算法进行数据分析和挖掘,包括ChIP-seq,ATAC-seq,RNA-seq,CNV等

课表内容

                  课程一: CADD计算机辅助药物设计课表内容

第一天

背景与理论知识以及工具准备

1.PDB数据库的介绍和使用

1.1数据库简介

1.2靶点蛋白的结构查询与选取

1.3靶点蛋白的结构序列下载

1.4靶点蛋白的下载与预处理

1.5批量下载蛋白晶体结构

pymol的介绍与使用

2.1软件基本操作及基本知识介绍

2.2蛋白质-配体相互作用图解

2.3蛋白-配体小分子表面图、静电势表示

2.4蛋白-配体结构叠加与比对

2.5绘制相互作用力

3.notepad的介绍和使用

3.1 优势及主要功能介绍

3.2 界面和基本操作介绍

3.3插件安装使用

一般的蛋白-配体分子对接讲解

1.对接的相关理论介绍

1.1分子对接的概念及基本原理

1.2分子对接的基本方法

1.3分子对接的常用软件

1.4分子对接的一般流程

2.常规的蛋白-配体对接

2.1收集受体与配体分子

2.2复合体预构象的处理

2.3准备受体、配体分子

2.4蛋白-配体对接

2.5对接结果的分析

以新冠病毒蛋白主蛋白酶靶点及相关抑制剂为例

第二天

虚拟筛选

1.小分子数据库的介绍与下载

2.相关程序的介绍

2.1 openbabel的介绍和使用

2.2 chemdraw的介绍与使用

3.虚拟筛选的前处理

4.虚拟筛选的流程及实战演示

案例:筛选新冠病毒主蛋白酶抑制剂

5.结果分析与作图

6.药物ADME预测

6.1ADME概念介绍

6.2预测相关网站及软件介绍

6.3预测结果的分析

第三天:

拓展对接的使用方法

1.蛋白-蛋白对接

1.1蛋白-蛋白对接的应用场景

1.2相关程序的介绍

1.3目标蛋白的收集以及预处理

1.4使用算例进行运算

1.5关键残基的预设

1.6结果的获取与文件类型

1.7结果的分析

以目前火热的靶点PD-1/PD-L1等为例。

2.涉及金属酶蛋白的对接

2.1 金属酶蛋白-配体的背景介绍

2.2蛋白与配体分子的收集与预处理

2.3金属离子的处理

2.4金属辅酶蛋白-配体的对接

2.5结果分析

以人类法尼基转移酶及其抑制剂为例

3.蛋白-多糖分子对接

4.1蛋白-多糖相互作用

4.2对接处理的要点

4.3蛋白-多糖分子对接的流程

4.4蛋白-多糖分子对接

4.5相关结果分析

以α-糖苷转移酶和多糖分子对接为例

4.核酸-小分子对接

4.1核酸-小分子的应用现状

4.2相关的程序介绍

4.3核酸-小分子的结合种类

4.4核酸-小分子对接

4.5相关结果的分析

以人端粒g -四链和配体分子对接为例。

操作流程介绍及实战演示

第四天

拓展对接的使用方法

1.柔性对接

1.1柔性对接的使用场景介绍

1.2柔性对接的优势

1.3蛋白-配体的柔性对接

重点:柔性残基的设置方法

1.4相关结果的分析

以周期蛋白依赖性激酶2(CDK2)与配体1CK为例

2.共价对接

2.1两种共价对接方法的介绍

2.1.1柔性侧链法

2.1.2两点吸引子法

2.2蛋白和配体的收集以及预处理

2.3共价药物分子与靶蛋白的共价对接

2.4结果的对比

以目前火热的新冠共价药物为例。

3.蛋白-水合对接

3.1水合作用在蛋白-配体相互作用中的意义及方法介绍

3.2蛋白和配体的收集以及预处理

3.3对接相关参数的准备

重点:水分子的加入和处理

3.4蛋白-水分子-配体对接

3.5结果分析

以乙酰胆碱结合蛋白(AChBP)与尼古丁复合物为例

第五天

分子动力学模拟Linux与gromacs

1. linux系统的介绍和简单使用

1.1 linux常用命令行

1.2 linux上的常用程序安装

1.3 体验:如何在linux上进行虚拟筛选

2.分子动力学的理论介绍

2.1分子动力学模拟的原理

2.2分子动力学模拟的方法及相关程序

2.3相关力场的介绍

3.gromacs使用及介绍

重点:主要命令及参数的介绍

4. origin介绍及使用

第六天

溶剂化分子动力学模拟的执行

1.一般的溶剂化蛋白的处理流程

2.蛋白晶体的准备

3.结构的能量最小化

4.对体系的预平衡

5.无限制的分子动力学模拟

6.分子动力学结果展示与解读

以水中的溶菌酶为例

第七天

蛋白-配体分子动力学模拟的执行

1.蛋白-配体在分子动力学模拟的处理流程

2.蛋白晶体的准备

3.蛋白-配体模拟初始构象的准备

4.配体分子力场拓扑文件的准备

4.1 gaussian的简要介绍

4.2 ambertool的简要介绍

4.3生成小分子的力场参数文件

5.对复合物体系温度和压力分别限制的预平衡

6.无限制的分子动力学模拟

7.分子动力学结果展示与解读

8.轨迹后处理及分析

以新冠病毒蛋白主蛋白酶靶点及相关抑制剂为例

部分模型案例图片

 

             课程二:AIDD人工智能药物发现与设计培训课表内容

第一天

人工智能药物发现

从CADD到AIDD的介绍

1.计算机辅助药物设计(CADD)简介

1.2.分子对接与分子动力学背景介绍

1.3.人工智能药物发现(AIDD)简介

2.机器学习与深度学习在药物发现中的背景介绍

2.1药物发现与设计

2.2基于结构的药物发现与设计

2.3基于配体的药物发现与设计

  工具的介绍与安装

3.1Anaconda3/Pycharm安装

3.2python 编程基础

3.3Pandas基础

3.4NumPy基础

3.5RDKit基础

3.6Pytorch基础

3.7Tensorflow基础

3.8DeepChem基础

第二天

机器学习与药物发现(分类任务) 

1.分类模型的构建与应用

1.1逻辑回归算法原理

1.2朴素贝叶斯算法原理

1.3k最近邻算法原理

1.4支持向量机算法原理

1.5随机森林算法原理

1.6梯度提升算法原理

1.7多层感知机算法原理

1.8特征工程

1.9缺失值填补

2.特征归一化

2.1变量筛选

2.2模型评估方法

2.3交叉验证

2.4外部验证

3.分类模型的常用评价指标

3.1混淆矩阵

3.2准确率

3.3敏感性

3.4特异性

3.5模型选择

3.6格点搜索超参数调优

3.7k折交叉验证

分类模型的实例讲解与练习,以给定数据集为例,讲解基于以上机器学习算法的生物活性或ADMET性质预测模型。引导学员构建自己的数据模型,并用于小分子化合物的活性或ADMET性质预测。

第三天

机器学习与药物发现(回归任务)

1.随机森林回归

2.支持向量机回归

3.XGboost回归

4.多层感知机回归

5.神经网络回归

6.回归模型的常用评价指标

6.1MSE

6.2RMSE

6.3MAE

6.4R2

QSAR/3D-QSAR模型

以给定数据集为例,讲解基于上述几种机器学习算法构建生物活性如pIC50或ADMET性质预测模型。

第四天

深度学习与药物发现

1.深度学习的发展历程与在药物开发中的应用

1.1多层感知机/人工神经网络

1.2基于梯度的学习

1.3反向传播算法

1.4随机梯度下降

1.5卷积神经网络介绍

1.6图神经网络介绍

基于PyTorch的多层感知机算法的实例讲解与练习

以给定数据集为例,讲解基于多层感知机的化合物性质预测模型。

以给定数据集为例,讲解基于卷积神经网络的化合物图像预测分类模型。

以给定数据集为例,讲解基于图神经网络对化合物的毒性分类预测模型。

第五天

分子生成模型

1.生成式对抗网络(GANs)的基本原理

1.2生成器

1.3判别器

1.4循环神经网络(RNN)

1.5长短期记忆网络(LSTM)

2.基于上下文的循环神经网络序列建模

3.基于字符串的小分子化合物生成模型

4.基于图数据的小分子化合物生成模型

实例讲解与练习,以给定数据集为例,构建分子生成模型。

课程三:深度学习在基因组学应用课表内容

第一天

深度学习基础

理论部分

深度学习基础

1.有监督学习中主要的神经网络算法

1.1全连接网络

1.2深度卷积

1.3循环卷积

1.4图卷积

2.多任务学习

3.多模态学习

4.迁移学习

5.非监督学习方法:自动编码器和生成对抗网络

实操内容

1.R语言基础

2.R(4.1.3)和Rstudio的安装

3.R包安装和环境搭建

4.数据结构和数据类型

第二天

深度学习在基因组学中的应用

理论部分

1.深度学习在基因组学中的应用

2.决策树算法

3.随机森林算法

4.支持向量机(SVM)算法简介

5.朴素贝叶斯

6.Xgboost

7.主成分分析PCA算法

8.聚类算法

9.DBSCAN算法

10.层次聚类算法

实操内容

1.Linux操作系统

1.1 Linux操作系统的安装与设置

1.2 网络配置与服务进程管理

1.3 Linux的远程登录管理

1.4 常用的Linux命令

1.5 在Linux下获取基因数据

1.6 利用Linux 探索基因组区域

1.7 Shell script与Vim编辑器

1.8 基因组文件下载与上传

1.9 Linux权限管理

2.文件的身份

3.修改文件的所有者和所属组

4.修改文件权限

第三天

1.卷积神经网络在基因组中的应用

2.循环神经网络在基因组中的应用

理论部分

1.功能基因组

2.结构基因组

3.表观基因组

4.基因组数据库

5.基因表达

实操内容

1.基因组环境搭建

2.Jupyter notebook的使用

3.Python语言基础

4.卷积神经网络在基因组中的应用

5.循环神经网络在基因组中的应用

第四天

(Nature等顶刊复现)

1.DNA甲基化预测

2.RNA结合预测

3.RNA二级结构预测

4.肿瘤RNA表达水平预测

理论部分

1.数据表示

2.张量运算

3.神经网络中的“层”

4.由层构成的模型

5.损失函数与优化器

6.数据集分配

7.过拟合与欠拟合

8.基因组常用深度学习框架

9.Keras

9.1 Tensorflow

9.2 PyTorch

9.3 Caffe

9.4 Theano

9.5 CNTK

9.6 MXNet

9.7 PaddlePaddle

9.8 Deeplearning4j

9.9 ONNX

实操内容

1.DNA甲基化预测

2.RNA结合预测

3.RNA二级结构预测

4.肿瘤RNA表达水平预测

5.Pre-mRNA的m6A修饰预测

6.蛋白亚细胞定位预测

(实操通过复现多篇Nature等顶刊 讲解代码,跑代码,助力学员发高分文献

授课时间地点

CADD计算机辅助药物设计专题培训班

2022.10.22 —–2022.10.23 全天授课(上午09:00-11:30 下午13:30-17:00)

2022.10.25—–2022.10.28 晚上授课(晚上19:00-22:00)

2022.10.29—–2022.10.30全天授课(上午09:00-11:30 下午13:30-17:00)

2022.10.31 —–2022.11.01晚上授课 (晚上19:00-22:00)

AIDD人工智能药物发现与设计专题培训班

2022.10.29—–2022.10.30全天授课(上午09:00-11:30 下午13:30-17:00)

2022.11.01—-2022.11.02 晚上授课(晚上1 9:00-22:00)

2022.11.05—-2022.11.06全天授课(上午09:00-11:30 下午13:30-17:00)

深度学习在基因组学应用专题培训

2022.10.22-2022.10.23 (09:00-11:30) – (13:30-17:00)

2022.10.29-2022.10.30 (09:00-11:30) – (13:30-17:00)

(腾讯会议直播上课 提供录像回放  录像永久观看)

培训福利

报名缴费成功赠送报名班型全套预习视频,课后学习完毕提供全程录像视频回放,针对与培训课程内容进行长期答疑,微信解疑群永不解散,参加本次课程的学员可免费再参加一次本单位后期组织的相同的专题培训班(任意一期都可以)

授课方式及学员反馈

通过腾讯会议线上直播,从零基础开始讲解,600余页电子PPT和教程+预习视频提前发送给学员,所有培训使用软件都会发送给学员,附赠安装教程和指导安装,培训采取开麦共享屏幕和微信群解疑,学员和老师交流、学员与学员交流,培训完毕后老师针对与培训内容长期解疑,培训群不解散,往期培训学员对于培训质量和授课方式一致评价极高

试看往期培训视频

链接:https://pan.baidu.com/s/1LG9d0Idg4Ia5rA9br1ePag

提取码:8888 

(一)学员实操及科研问题老师解答

(二)学员对培训非常认可,而且我们保证二次学习是免费的

往期学员参会单位及报名流程

有来自四川大学、四川师范大学、中国科学院大学、西安电子科技大学、陕西科技大学、东北林业大学、渤海大学、海南大学、广西中医药大学、北京化工大学、成都大学、香港浸会大学中医药学院、赣南师范大学、重庆陆军勤务学院、齐鲁工业大学、陕西科技大学、陕西师范大学、中科院大学 、浙江工商大学、成都中医药大学、上海交通大学、哈尔滨商业大学、中国人民解放军海军军医大学、西安电子科技大学、中国农业大学、南昌大学、新疆医科大学、山东农业大学、合肥工业大学、清华大学、华中农业大学、山东理工大学、北京工商大学、河南大学、江苏大学、江南大学、大连工业大学、华南理工大学、华南农业大学、成都中医药大学、东北林业大学、北京大学、浙江大学、浙江工业大学、中南大学、复旦大学、南京农业大学、齐鲁工业大学、东北大学、国防科技大学、江苏海洋大学、华东理工大学、华中科技大学、湖北大学、中国医学科学院、西南大学、中南大学湘雅医院、山西省人民医院、中国药科大学、西安市中医医院、首都医科大学附属北京友谊医院、上海市第十人民医院、协和药物研究所、中国农业科学院基因组研究所、广州中医药大学、上海中医药大学、上海理工大学、成都中医药大学、北京中医药大学、武汉大学、香港大学、安阳工学院、沈阳药科大学、中山大学肿瘤防治中心、山东中医药大学、宁波大学、宁夏大学、山东大学、甘肃中医药大学、医学院附属仁济医院、杭州医学院、广州医科大学附属肿瘤医院、中山大学孙逸仙纪念医院、江苏省中医院、承德医学院、中国中医科学院广安门医院、中山大学附属第五医院、中山大学中山眼科中心、汕头大学、扬州大学、天津科技大学、吉林农业大学、上海应用技术大学、空军军医大学、首都医科大学附属北京友谊医院、中国科学院海洋研究所、中国科学院深圳先进技术研究院、深圳湾实验室、江苏省淡水水产研究所、广东省科学院测试分析研究所(中国广州分析测试中心)、中国科学院昆明植物研究所、中国科学院植物研究所、中国科学院苏州纳米技术与纳米仿生研究所、江苏省淡水水产研究所、中国食品发酵工业研究院、中国中医科学院中药研究所、中国科学院海洋研究所、深圳清华大学研究院、国科大杭州高等研究院、美国贝勒医学院等高校,康希诺生物股份公司、青峰制药、江苏恒瑞、上海青玄生物、石药集团、正大天晴、宜昌人福药业有限责任公司、江苏中旗科技有限公司、长春金赛药业有限责任公司、丽珠医药集团股份有限公司、大连医诺生物股份有限公司、南京盛德瑞尔医药科技有限公司、上海兰天生物医药科技有限公司、深圳研顺生物科技有限公司、中国农业科学院蜜蜂研究所、上海森辉医药有限公司、上海硕迪生物技术有限公司、云南腾善生物科技有限公司、湖南九典制药股份有限公司、北京先为达生物科技有限公司、广东省深圳市南山区中科院深圳先进院、无锡佰翱得生物科学有限公司、苏州沪云新药研发股份有限公司、深圳市灵蛛科技有限公司、潍坊易北特健康食品有限公司、江苏三黍生物科技有限公司、苏州浦合医药科技有限公司、丽珠医药集团股份有限公司、兰晟生物医药(苏州)有限公司、甫康(上海)健康科技有限责任公司、南京盛德瑞尔医药科技有限公司、深圳市领治医学科技有限公司、北京安必奇生物科技有限公司、国家纳米科学中心、四川国康药业有限公司、南通药明康德医药科技有限公司、南京沛微生物科技有限公司、北京科诺信诚科技有限公司、天士力生物医药股份有限公司、泽达易盛(天津)科技股份有限公司、沈阳市青囊医疗科技有限责任公司、石家庄以岭药业股份有限公司、青岛科博源生物技术有限公司、中科聚研(吉林)干细胞科技有限公司、广州同隽医药科技有限公司、南通奥贝特化工有限公司、北京斯利安药业有限公司、上海韵和生物医药有限公司、杭州百诚医药科技股份有限公司、上海倍勘生物技术有限公司、长春金赛药业有限责任公司、浙江海正股份有限公司等公司的八百余名工程师老师学生参会,还有许多因为时间冲突没法参加。这次,我们诚挚邀请您来参加!

报名咨询请二维码扫描下方微信

 

资源下载: