人工智能輔助藥物設計
常珊 謝良旭
買這商品的人也買了...
-
$580$458 -
$403Python 商業數據分析:零售和電子商務案例詳解
-
$774$735 -
$594$564 -
$680$537 -
$880$695 -
$720$569 -
$680$510 -
$680$530 -
$594$564
相關主題
商品描述
本書著重介紹人工智能技術在醫藥研發領域的應用。全書按照循序漸進的方式組織內容:先介紹人工智能的基本方法和生物醫藥的基本概念,然後介紹人工智能在分子表示、藥物分子性質預測、分子生成、配體與蛋白質結合能力預測,以及蛋白質結構預測等新藥研發任務中的具體應用,並結合具體示例,介紹如何將人工智能方法應用到實際的藥物研發中。
要想更好地掌握本書涵蓋的內容,讀者須掌握 Python 語言和藥物學的基礎知識。本書適合想瞭解人工智能輔助藥物研發的從業人員、高等院校醫工交叉學科的學生閱讀,也適合對人工智能輔助醫藥研發感興趣的藥物研發人員、程序員閱讀。
作者簡介
常珊 教授,美国密苏里大学哥伦比亚分校博士后,江苏理工学院生物信息与医药工程研究所所长。主要研究方向为人工智能辅助药物设计、机器学习和高性能计算。近年来,发表学术论文 120 余篇,被 SCI 检索 100 余篇,Google Scholar 引用 1700 余次,获得软件著作权 14 项,申请发明专利 35 项(授权 9 项),参与出版专著 3 部,译著 1 部。主持国家自然科学基金面上项目 1 项,完成国家自然科学基金 2 项、NSFC- 广东联合基金子课题 1 项以及其他省部级和企业横向课题 10 余个。多次参加国际生物分子结构预测竞赛(CASP),排名位居国际前列,在 2022 年的 CASP 15 中获得蛋白质 -Ligand 预测赛道冠军。
谢良旭 香港大学博士,江苏理工学院生物信息与医药工程研究所副研究员。中国化学会会员、中国人工智能学会终身会员、Current Topics in Medicinal Chemistry 专刊编辑、江苏省中以产业技术研究院青年博士创新联盟成员。主要研究方向为人工智能辅助药物筛选和探索重要生物过程的分子机制。荣获江苏省高等学校科学技术研究成果三等奖,入选江苏省“双创博士”计划、常州市青年科技人才托举工程项目。近年来,发表 SCI 论文 40 余篇,主持国家自然科学基金、江苏省自然科学基金等多个项目。
目錄大綱
第 1章 緒論 1
1.1 人工智能發展歷史 1
1.2 傳統電腦輔助藥物設計的歷史 3
1.3 人工智能輔助藥物研發概況 3
第 2章 機器學習的基本概念 5
2.1 機器學習、深度學習與人工智能 5
2.1.1 人工智能 5
2.1.2 機器學習的關鍵術語 7
2.2 機器學習的分類 12
2.2.1 按任務類型分類 12
2.2.2 按學習方式分類 13
2.3 機器學習與藥物研發 14
2.3.1 藥物設計方法 15
2.3.2 藥物設計中常見的機器學習方法 16
2.3.3 預測模型的構建 17
2.4 參考資料 18
第3章 支持向量機 20
3.1 支持向量機簡介 20
3.2 間隔與支持向量 21
3.3 核函數 22
3.4 軟間隔與正則化 25
3.5 支持向量回歸 29
3.6 支持向量機算法 31
3.6.1 選塊算法 31
3.6.2 分解算法 32
3.6.3 模糊支持向量機算法 32
3.6.4 序貫最小優化算法 33
3.7 示例 34
3.8 參考資料 37
第4章 決策樹 39
4.1 決策樹簡介 39
4.2 決策樹劃分選擇 40
4.2.1 信息熵 40
4.2.2 信息增益 42
4.2.3 信息增益率 44
4.2.4 基尼指數 45
4.3 示例 46
第5章 集成學習 51
5.1 集成學習簡介 51
5.1.1 Bagging 52
5.1.2 Boosting 53
5.2 集成方法 54
5.2.1 集成學習的結合策略 54
5.2.2 增加基學習器多樣性的
方法 55
5.3 隨機森林 56
5.4 示例 57
5.5 參考資料 64
第6章 k近鄰算法 65
6.1 k近鄰算法概述 65
6.1.1 k近鄰算法 65
6.1.2 距離加權近鄰算法 67
6.1.3 對k近鄰算法的說明 68
6.2 k近鄰算法的實現 69
6.2.1 準備:使用Python導入數據 70
6.2.2 從文本文件中解析數據 71
6.2.3 如何測試分類器 72
6.3 示例:用k近鄰算法改進約會網站的配對效果 72
6.4 示例:手寫識別系統 79
6.5 參考資料 82
第7章 神經網絡 84
7.1 生物神經元對人工神經元的啟發 84
7.2 生物神經網絡與人工神經網絡的主要區別 86
7.3 前饋神經網絡 87
7.4 反向傳播算法 89
7.5 激活函數 90
7.5.1 Logistic函數 91
7.5.2 Tanh函數 91
7.5.3 ReLU函數 92
7.5.4 Leaky ReLU函數 93
7.5.5 Swish函數 93
7.6 用Tensorflow構建神經網絡,實現激酶抑制劑分類 94
7.6.1 數據預處理 94
7.6.2 神經網絡構建 96
7.6.3 模型訓練 98
7.6.4 模型使用 99
7.7 參考資料 100
第8章 捲積神經網絡 102
8.1 捲積神經網絡的結構 102
8.1.1 捲積層 102
8.1.2 池化層 107
8.1.3 反池化 110
8.1.4 激活函數層 111
8.1.5 全連接層 111
8.2 捲積神經網絡的相關計算 112
8.2.1 特徵圖 112
8.2.2 感受野 113
8.2.3 填充 114
8.2.4 膨脹捲積 115
8.3 示例:用捲積神經網絡預測藥物分子性質 116
8.4 參考資料 118
第9章 生成式深度學習 119
9.1 深度學習與GAN 119
9.1.1 深度學習 119
9.1.2 GAN 120
9.2 GAN的相關概念 121
9.2.1 梯度下降法 121
9.2.2 信息熵與KL散度 122
9.2.3 納什均衡 123
9.2.4 高斯分佈和高斯過程 123
9.3 GAN理論基礎 124
9.3.1 什麽是GAN 124
9.3.2 GAN的原理 124
9.4 GAN的訓練過程 126
9.4.1 訓練判別器D 127
9.4.2 訓練生成器G 127
9.5 GAN的應用與代碼示例 128
9.6 GAN的特點和GAN ZOO 132
9.6.1 GAN的優點 132
9.6.2 GAN的缺點 132
9.6.3 GAN ZOO 133
9.7 參考資料 134
第 10章 Python編程基礎與計算環境搭建 135
10.1 Python簡介 135
10.2 Python基本編程 136
10.2.1 Anaconda介紹 137
10.2.2 安裝Anaconda 137
10.2.3 終端窗口運行Python代碼片段 140
10.2.4 PyCharm簡介 140
10.2.5 配置PyCharm 140
10.2.6 在PyCharm中編寫Python腳本 142
10.3 Python語言基本要素 143
10.3.1 基本數據類型 143
10.3.2 if語句 147
10.3.3 循環語句 147
10.3.4 函數 148
10.3.5 類 149
10.4 深度學習框架的搭建 150
10.4.1 TensorFlow和PyTorch簡介 150
10.4.2 安裝TensorFlow 151
10.4.3 安裝PyTorch 152
10.5 參考資料 154
第 11章 常用數據庫介紹 155
11.1 藥物數據庫 155
11.1.1 PubChem數據庫 155
11.1.2 DrugBank數據庫 158
11.1.3 DGIdb 160
11.1.4 ChEMBL 161
11.1.5 ETCM 164
11.2 蛋白質數據庫 165
11.2.1 UniProt數據庫 165
11.2.2 PDB 167
11.2.3 NCBI數據庫 168
11.2.4 SMART數據庫 170
11.2.5 Pfam數據庫 172
11.2.6 STRING 172
11.2.7 其他蛋白質數據庫 174
11.3 藥物-靶點數據庫 174
11.3.1 TTD 174
11.3.2 BindingDB 175
11.3.3 其他藥物-靶點數據庫 177
11.4 參考資料 178
第 12章 分子對接 180
12.1 電腦輔助藥物設計概念 180
12.2 分子對接的原理與分類 182
12.2.1 分子對接的原理 182
12.2.2 分子對接的分類 182
12.3 分子對接的操作流程 183
12.4 人工智能在分子對接中的應用 191
12.4.1 打分函數 191
12.4.2 蛋白質-配體分子對接中的機器學習 192
12.4.3 基於深度學習的多肽與蛋白質相互作用的預測框架 192
12.5 參考資料 193
第 13章 QSAR的深度學習新應用 195
13.1 QSAR 195
13.1.1 QSAR的定義 195
13.1.2 QSAR的發展簡介 196
13.1.3 QSAR模型研究方法 197
13.2 傳統的QSAR 199
13.2.1 2D-QSAR的基本原理 199
13.2.2 3D-QSAR的基本原理 201
13.3 QSAR模型構建步驟 203
13.3.1 軟件介紹 203
13.3.2 3D-QSAR操作步驟 203
13.4 機器學習背景下的QSAR 211
13.4.1 常見的機器學習方法 212
13.4.2 深度學習方法 213
13.5 參考資料 214
第 14章 分子的特徵工程 218
14.1 藥物分子結構 218
14.1.1 什麽是分子 218
14.1.2 什麽是分子鍵 218
14.1.3 什麽是分子構象 219
14.1.4 什麽是分子的手性 220
14.2 分子描述符 221
14.2.1 什麽是分子描述符 221
14.2.2 分子描述符的分類 221
14.2.3 SMILES字符串 222
14.2.4 SMARTS字符串 223
14.3 分子指紋 224
14.3.1 什麽是分子指紋 224
14.3.2 分子訪問系統結構鍵 224
14.3.3 擴展連通性指紋 225
14.4 藥物分子的特徵工程 226
14.4.1 什麽是分子特徵 226
14.4.2 其他特徵化方法 226
14.4.3 特徵選擇 227
14.5 參考資料 228
第 15章 藥物分子性質預測 231
15.1 藥物代謝動力學 231
15.1.1 藥物代謝動力學介紹 231
15.1.2 ADMET簡介 232
15.1.3 解離常數 233
15.2 Lipinski原則 233
15.2.1 Lipinski原則介紹 233
15.2.2 Lipinski原則的簡單程序實現 234
15.3 機器學習中的藥物分子性質預測 235
15.3.1 數據特徵化處理 235
15.3.2 機器學習預測藥物分子性質 237
15.4 深度學習中的藥物分子性質預測 239
15.4.1 特徵化處理和數據集劃分 239
15.4.2 深度學習預測藥物分子性質 241
15.5 參考資料 244
第 16章 分子從頭生成 245
16.1 先導化合物的優化 245
16.2 藥物分子設計的原則 245
16.2.1 前藥設計 245
16.2.2 孿藥設計 247
16.2.3 軟藥設計 247
16.3 傳統的先導化合物優化 247
16.3.1 採用生物電子等排體進行替換 247
16.3.2 生物電子等排體的分類 248
16.4 電腦輔助的先導化合物優化 249
16.4.1 QSAR 249
16.4.2 骨架躍遷 251
16.5 分子從頭生成簡介 252
16.5.1 什麽是分子從頭生成 252
16.5.2 分子生成的分類 253
16.6 深度學習與分子從頭生成 254
16.6.1 分子從頭生成背景 254
16.6.2 分子從頭生成模型 256
16.6.3 分子從頭生成的挑戰 258
16.7 參考資料 259
第 17章 蛋白質結構預測 262
17.1 蛋白質的結構與功能 262
17.1.1 蛋白質的結構層次 262
17.1.2 蛋白質的功能 264
17.2 蛋白質折疊動力學簡介 264
17.2.1 蛋白質折疊 264
17.2.2 蛋白質折疊動力學 265
17.3 蛋白質結構預測算法 266
17.3.1 遺傳算法 266
17.3.2 模擬退火算法 267
17.3.3 同源建模方法 268
17.4 蛋白質結構預測的顛覆性發展 269
17.5 基於蛋白質結構預測的藥物設計 271
17.5.1 分子對接 271
17.5.2 基於半監督學習的藥物-靶點相互作用研究 272
17.5.3 藥物-靶點結合親和力研究 273
17.6 參考資料 274
第 18章 蛋白質-分子結合的深度學習預測 276
18.1 藥物靶點的基本概念 276
18.2 藥物靶點與小分子的相互作用 277
18.3 藥物靶點與小分子的結合自由能的計算 278
18.3.1 基於物理模型的方法 279
18.3.2 經驗打分函數 280
18.3.3 基於知識的方法 281
18.3.4 基於深度學習的蛋白質-配體分子結合能力 281
18.4 人工智能預測蛋白質-配體分子結合能的實戰 283
18.4.1 藥物靶點與小分子的特徵提取 283
18.4.2 基於蛋白質與配體相互作用的指紋提取 284
18.4.3 人工智能模型預測蛋白質-配體結合常數 285
18.5 參考資料 288