人工智能輔助藥物設計

常珊 謝良旭

  • 出版商: 人民郵電
  • 出版日期: 2024-07-01
  • 定價: $659
  • 售價: 8.5$560
  • 語言: 簡體中文
  • 頁數: 288
  • ISBN: 7115633924
  • ISBN-13: 9787115633927
  • 下單後立即進貨 (約2週~3週)

  • 人工智能輔助藥物設計-preview-1
  • 人工智能輔助藥物設計-preview-2
人工智能輔助藥物設計-preview-1

買這商品的人也買了...

商品描述

本書著重介紹人工智能技術在醫藥研發領域的應用。全書按照循序漸進的方式組織內容:先介紹人工智能的基本方法和生物醫藥的基本概念,然後介紹人工智能在分子表示、藥物分子性質預測、分子生成、配體與蛋白質結合能力預測,以及蛋白質結構預測等新藥研發任務中的具體應用,並結合具體示例,介紹如何將人工智能方法應用到實際的藥物研發中。

要想更好地掌握本書涵蓋的內容,讀者須掌握 Python 語言和藥物學的基礎知識。本書適合想瞭解人工智能輔助藥物研發的從業人員、高等院校醫工交叉學科的學生閱讀,也適合對人工智能輔助醫藥研發感興趣的藥物研發人員、程序員閱讀。

作者簡介

常珊 教授,美国密苏里大学哥伦比亚分校博士后,江苏理工学院生物信息与医药工程研究所所长。主要研究方向为人工智能辅助药物设计、机器学习和高性能计算。近年来,发表学术论文 120 余篇,被 SCI 检索 100 余篇,Google Scholar 引用 1700 余次,获得软件著作权 14 项,申请发明专利 35 项(授权 9 项),参与出版专著 3 部,译著 1 部。主持国家自然科学基金面上项目 1 项,完成国家自然科学基金 2 项、NSFC- 广东联合基金子课题 1 项以及其他省部级和企业横向课题 10 余个。多次参加国际生物分子结构预测竞赛(CASP),排名位居国际前列,在 2022 年的 CASP 15 中获得蛋白质 -Ligand 预测赛道冠军。

 

谢良旭 香港大学博士,江苏理工学院生物信息与医药工程研究所副研究员。中国化学会会员、中国人工智能学会终身会员、Current Topics in Medicinal Chemistry 专刊编辑、江苏省中以产业技术研究院青年博士创新联盟成员。主要研究方向为人工智能辅助药物筛选和探索重要生物过程的分子机制。荣获江苏省高等学校科学技术研究成果三等奖,入选江苏省“双创博士”计划、常州市青年科技人才托举工程项目。近年来,发表 SCI 论文 40 余篇,主持国家自然科学基金、江苏省自然科学基金等多个项目。

目錄大綱

第 1章 緒論 1

1.1 人工智能發展歷史 1

1.2 傳統電腦輔助藥物設計的歷史 3

1.3 人工智能輔助藥物研發概況 3

第 2章 機器學習的基本概念 5

2.1 機器學習、深度學習與人工智能 5

2.1.1 人工智能 5

2.1.2 機器學習的關鍵術語 7

2.2 機器學習的分類 12

2.2.1 按任務類型分類 12

2.2.2 按學習方式分類 13

2.3 機器學習與藥物研發 14

2.3.1 藥物設計方法 15

2.3.2 藥物設計中常見的機器學習方法 16

2.3.3 預測模型的構建 17

2.4 參考資料 18

第3章 支持向量機 20

3.1 支持向量機簡介 20

3.2 間隔與支持向量 21

3.3 核函數 22

3.4 軟間隔與正則化 25

3.5 支持向量回歸 29

3.6 支持向量機算法 31

3.6.1 選塊算法 31

3.6.2 分解算法 32

3.6.3 模糊支持向量機算法 32

3.6.4 序貫最小優化算法 33

3.7 示例 34

3.8 參考資料 37

第4章 決策樹 39

4.1 決策樹簡介 39

4.2 決策樹劃分選擇 40

4.2.1 信息熵 40

4.2.2 信息增益 42

4.2.3 信息增益率 44

4.2.4 基尼指數 45

4.3 示例 46

第5章 集成學習 51

5.1 集成學習簡介 51

5.1.1 Bagging 52

5.1.2 Boosting 53

5.2 集成方法 54

5.2.1 集成學習的結合策略 54

5.2.2 增加基學習器多樣性的

方法 55

5.3 隨機森林 56

5.4 示例 57

5.5 參考資料 64

第6章 k近鄰算法 65

6.1 k近鄰算法概述 65

6.1.1 k近鄰算法 65

6.1.2 距離加權近鄰算法 67

6.1.3 對k近鄰算法的說明 68

6.2 k近鄰算法的實現 69

6.2.1 準備:使用Python導入數據 70

6.2.2 從文本文件中解析數據 71

6.2.3 如何測試分類器 72

6.3 示例:用k近鄰算法改進約會網站的配對效果 72

6.4 示例:手寫識別系統 79

6.5 參考資料 82

第7章 神經網絡 84

7.1 生物神經元對人工神經元的啟發 84

7.2 生物神經網絡與人工神經網絡的主要區別 86

7.3 前饋神經網絡 87

7.4 反向傳播算法 89

7.5 激活函數 90

7.5.1 Logistic函數 91

7.5.2 Tanh函數 91

7.5.3 ReLU函數 92

7.5.4 Leaky ReLU函數 93

7.5.5 Swish函數 93

7.6 用Tensorflow構建神經網絡,實現激酶抑制劑分類 94

7.6.1 數據預處理 94

7.6.2 神經網絡構建 96

7.6.3 模型訓練 98

7.6.4 模型使用 99

7.7 參考資料 100

第8章 捲積神經網絡 102

8.1 捲積神經網絡的結構 102

8.1.1 捲積層 102

8.1.2 池化層 107

8.1.3 反池化 110

8.1.4 激活函數層 111

8.1.5 全連接層 111

8.2 捲積神經網絡的相關計算 112

8.2.1 特徵圖 112

8.2.2 感受野 113

8.2.3 填充 114

8.2.4 膨脹捲積 115

8.3 示例:用捲積神經網絡預測藥物分子性質 116

8.4 參考資料 118

第9章 生成式深度學習 119

9.1 深度學習與GAN 119

9.1.1 深度學習 119

9.1.2 GAN 120

9.2 GAN的相關概念 121

9.2.1 梯度下降法 121

9.2.2 信息熵與KL散度 122

9.2.3 納什均衡 123

9.2.4 高斯分佈和高斯過程 123

9.3 GAN理論基礎 124

9.3.1 什麽是GAN 124

9.3.2 GAN的原理 124

9.4 GAN的訓練過程 126

9.4.1 訓練判別器D 127

9.4.2 訓練生成器G 127

9.5 GAN的應用與代碼示例 128

9.6 GAN的特點和GAN ZOO 132

9.6.1 GAN的優點 132

9.6.2 GAN的缺點 132

9.6.3 GAN ZOO 133

9.7 參考資料 134

第 10章 Python編程基礎與計算環境搭建 135

10.1 Python簡介 135

10.2 Python基本編程 136

10.2.1 Anaconda介紹 137

10.2.2 安裝Anaconda 137

10.2.3 終端窗口運行Python代碼片段 140

10.2.4 PyCharm簡介 140

10.2.5 配置PyCharm 140

10.2.6 在PyCharm中編寫Python腳本 142

10.3 Python語言基本要素 143

10.3.1 基本數據類型 143

10.3.2 if語句 147

10.3.3 循環語句 147

10.3.4 函數 148

10.3.5 類 149

10.4 深度學習框架的搭建 150

10.4.1 TensorFlow和PyTorch簡介 150

10.4.2 安裝TensorFlow 151

10.4.3 安裝PyTorch 152

10.5 參考資料 154

第 11章 常用數據庫介紹 155

11.1 藥物數據庫 155

11.1.1 PubChem數據庫 155

11.1.2 DrugBank數據庫 158

11.1.3 DGIdb 160

11.1.4 ChEMBL 161

11.1.5 ETCM 164

11.2 蛋白質數據庫 165

11.2.1 UniProt數據庫 165

11.2.2 PDB 167

11.2.3 NCBI數據庫 168

11.2.4 SMART數據庫 170

11.2.5 Pfam數據庫 172

11.2.6 STRING 172

11.2.7 其他蛋白質數據庫 174

11.3 藥物-靶點數據庫 174

11.3.1 TTD 174

11.3.2 BindingDB 175

11.3.3 其他藥物-靶點數據庫 177

11.4 參考資料 178

第 12章 分子對接 180

12.1 電腦輔助藥物設計概念 180

12.2 分子對接的原理與分類 182

12.2.1 分子對接的原理 182

12.2.2 分子對接的分類 182

12.3 分子對接的操作流程 183

12.4 人工智能在分子對接中的應用 191

12.4.1 打分函數 191

12.4.2 蛋白質-配體分子對接中的機器學習 192

12.4.3 基於深度學習的多肽與蛋白質相互作用的預測框架 192

12.5 參考資料 193

第 13章 QSAR的深度學習新應用 195

13.1 QSAR 195

13.1.1 QSAR的定義 195

13.1.2 QSAR的發展簡介 196

13.1.3 QSAR模型研究方法 197

13.2 傳統的QSAR 199

13.2.1 2D-QSAR的基本原理 199

13.2.2 3D-QSAR的基本原理 201

13.3 QSAR模型構建步驟 203

13.3.1 軟件介紹 203

13.3.2 3D-QSAR操作步驟 203

13.4 機器學習背景下的QSAR 211

13.4.1 常見的機器學習方法 212

13.4.2 深度學習方法 213

13.5 參考資料 214

第 14章 分子的特徵工程 218

14.1 藥物分子結構 218

14.1.1 什麽是分子 218

14.1.2 什麽是分子鍵 218

14.1.3 什麽是分子構象 219

14.1.4 什麽是分子的手性 220

14.2 分子描述符 221

14.2.1 什麽是分子描述符 221

14.2.2 分子描述符的分類 221

14.2.3 SMILES字符串 222

14.2.4 SMARTS字符串 223

14.3 分子指紋 224

14.3.1 什麽是分子指紋 224

14.3.2 分子訪問系統結構鍵 224

14.3.3 擴展連通性指紋 225

14.4 藥物分子的特徵工程 226

14.4.1 什麽是分子特徵 226

14.4.2 其他特徵化方法 226

14.4.3 特徵選擇 227

14.5 參考資料 228

第 15章 藥物分子性質預測 231

15.1 藥物代謝動力學 231

15.1.1 藥物代謝動力學介紹 231

15.1.2 ADMET簡介 232

15.1.3 解離常數 233

15.2 Lipinski原則 233

15.2.1 Lipinski原則介紹 233

15.2.2 Lipinski原則的簡單程序實現 234

15.3 機器學習中的藥物分子性質預測 235

15.3.1 數據特徵化處理 235

15.3.2 機器學習預測藥物分子性質 237

15.4 深度學習中的藥物分子性質預測 239

15.4.1 特徵化處理和數據集劃分 239

15.4.2 深度學習預測藥物分子性質 241

15.5 參考資料 244

第 16章 分子從頭生成 245

16.1 先導化合物的優化 245

16.2 藥物分子設計的原則 245

16.2.1 前藥設計 245

16.2.2 孿藥設計 247

16.2.3 軟藥設計 247

16.3 傳統的先導化合物優化 247

16.3.1 採用生物電子等排體進行替換 247

16.3.2 生物電子等排體的分類 248

16.4 電腦輔助的先導化合物優化 249

16.4.1 QSAR 249

16.4.2 骨架躍遷 251

16.5 分子從頭生成簡介 252

16.5.1 什麽是分子從頭生成 252

16.5.2 分子生成的分類 253

16.6 深度學習與分子從頭生成 254

16.6.1 分子從頭生成背景 254

16.6.2 分子從頭生成模型 256

16.6.3 分子從頭生成的挑戰 258

16.7 參考資料 259

第 17章 蛋白質結構預測 262

17.1 蛋白質的結構與功能 262

17.1.1 蛋白質的結構層次 262

17.1.2 蛋白質的功能 264

17.2 蛋白質折疊動力學簡介 264

17.2.1 蛋白質折疊 264

17.2.2 蛋白質折疊動力學 265

17.3 蛋白質結構預測算法 266

17.3.1 遺傳算法 266

17.3.2 模擬退火算法 267

17.3.3 同源建模方法 268

17.4 蛋白質結構預測的顛覆性發展 269

17.5 基於蛋白質結構預測的藥物設計 271

17.5.1 分子對接 271

17.5.2 基於半監督學習的藥物-靶點相互作用研究 272

17.5.3 藥物-靶點結合親和力研究 273

17.6 參考資料 274

第 18章 蛋白質-分子結合的深度學習預測 276

18.1 藥物靶點的基本概念 276

18.2 藥物靶點與小分子的相互作用 277

18.3 藥物靶點與小分子的結合自由能的計算 278

18.3.1 基於物理模型的方法 279

18.3.2 經驗打分函數 280

18.3.3 基於知識的方法 281

18.3.4 基於深度學習的蛋白質-配體分子結合能力 281

18.4 人工智能預測蛋白質-配體分子結合能的實戰 283

18.4.1 藥物靶點與小分子的特徵提取 283

18.4.2 基於蛋白質與配體相互作用的指紋提取 284

18.4.3 人工智能模型預測蛋白質-配體結合常數 285

18.5 參考資料 288