智能語音技術及應用開發

付麗琴,邢亞英,王家波

  • 出版商: 電子工業
  • 出版日期: 2024-11-01
  • 定價: $270
  • 售價: 8.5$229
  • 語言: 簡體中文
  • 頁數: 198
  • ISBN: 7121492512
  • ISBN-13: 9787121492518
  • 下單後立即進貨 (約4週~6週)

相關主題

商品描述

本書對接智能語音開發運維崗位要求、人工智能語音應用開發1+X職業技能等級標準,內容涉及語音及智能語音相關技術的基本概念與簡單應用,並對語音識別、聲紋識別、語音合成、語音評測等重點應用的技術框架和開發技術進行了介紹。本書可作為高職高專及應用型本科人工智能專業學生的專業課教材,也適合對語音技術感興趣的學員或從事語音技術開發運維崗位的人員參考。

目錄大綱

單元1 初步瞭解語音 1
任務1.1 瞭解語音的產生 1
1.1.1 語音的屬性 1
1.1.2 語音的產生 2
1.1.3 語音中蘊含的信息 4
任務1.2 瞭解數字語音 8
1.2.1 什麽是數字聲音 9
1.2.2 語音信號數字化 10
1.2.3 數字語音存儲與回放系統 13
習題 16
單元2 智能語音相關技術 17
任務2.1 瞭解智能語音技術的內涵及應用 17
2.1.1 智能語音技術的相關概念 18
2.1.2 深度學習技術 19
2.1.3 神經網絡技術 20
任務2.2 瞭解語音語料庫 22
2.2.1 語音語料庫的應用 23
2.2.2 情感語音語料庫 24
2.2.3 語音語料庫建立的規範 26
任務2.3 實現語音數據標註 28
2.3.1 語音數據標註的基礎知識 29
2.3.2 音段標註和韻律標註 30
2.3.3 語音數據標註的工具 30
習題 37
單元3 語音識別技術應用 38
任務3.1 理解語音識別開發技術框架 38
3.1.1 語音識別技術的內涵 38
3.1.2 語音識別的流程 39
3.1.3 基於訊飛開放平臺的語音識別流程及接口應用 41
任務3.2 實現基於TensorFlow搭建語音識別系統 55
3.2.1 MFCC特徵提取 55
3.2.2 搭建基於TensorFlow的深度學習模型 57
任務3.3 實現性別和年齡信息識別 64
3.3.1 基於AI開放平臺的語音識別及相關術語 65
3.3.2 語音識別接口調用模塊代碼說明 65
習題 75
單元4 聲紋識別技術應用 76
任務4.1 瞭解聲紋識別的技術框架 76
4.1.1 聲紋識別的內涵 77
4.1.2 聲紋識別的一般流程和關鍵技術 79
4.1.3 聲紋識別系統評價 82
任務4.2 基於訊飛開放平臺實現聲紋識別 85
4.2.1 基於訊飛開放平臺的聲紋識別開發框架 86
4.2.2 基於訊飛開放平臺的聲紋識別流程 87
任務4.3 代碼分析與問題盤點 96
4.3.1 理解基於訊飛開放平臺的聲紋識別接口應用 96
4.3.2 總結系統開發中的常見問題 111
4.3.3 程序調試中的常見錯誤碼 111
習題 112
單元5 語音合成技術及應用 113
任務5.1 瞭解語音合成基礎 113
5.1.1 語音合成技術的演化 114
5.1.2 語音合成的常用平臺 116
任務5.2 理解個性化語音合成技術 120
5.2.1 語音的個性特徵 120
5.2.2 語音合成的技術框架 121
任務5.3 實現基於AI開放平臺的語音合成 128
5.3.1 基於訊飛開放平臺的語音合成流程及接口應用 128
5.3.2 語音合成產品的評價 134
5.3.3 語音合成應用開發中的問題盤點 138
習題 141
單元6 語音評測技術應用 142
任務6.1 瞭解語音評測的技術框架 142
6.1.1 語音評測技術的內涵及術語 142
6.1.2 語音評測的技術框架 144
任務6.2 開發中文朗讀發音評測系統 152
6.2.1 基於AI開放平臺的語音評測及相關術語 154
6.2.2 基於訊飛開放平臺的語音評測流程及接口應用 154
任務6.3 語音評測產品開發中的實施 165
6.3.1 中文評測試題格式 166
6.3.2 英文評測試題格式 168
6.3.3 英文音標標註試題製作規範 170
習題 173
單元7 語音技術綜合實踐 174
任務7.1 設計虛擬主播 174
7.1.1 瞭解虛擬主播 174
7.1.2 虛擬主播的主要技術 177
7.1.3 虛擬主播的平臺實現 179
任務7.2 設計社區居民情況調查智能客服系統 181
7.2.1 人工智能訓練師職業認知 182
7.2.2 人機交互與智能客服 182