理解大語言模型:學習其基本思想和技術

何明 鄒明光 董經緯

  • 出版商: 西安交通大學
  • 出版日期: 2024-09-01
  • 售價: $450
  • 貴賓價: 9.5$428
  • 語言: 簡體中文
  • 頁數: 180
  • ISBN: 7569338812
  • ISBN-13: 9787569338812
  • 相關分類: LangChain
  • 立即出貨 (庫存 < 4)

相關主題

商品描述

隨著人工智能技術飛速發展,近兩年出現了以chatGPT為代表的智能化程度極高的處理工具,支撐它們的關鍵技術就是大語言模型(LLM)。大語言模型(LLM)是人工智能在自然語言處理領域的應用,也是人工智能的最新前沿,源於自然語言處理(NLP)和深度學習的研究發展。本書首先介紹了大語言模型的基本情況,講述了自然語言處理的發展歷史、基本概念和主要任務。以一種重要的大語言模型Transformer模型為例介紹了大建模語言的基礎模型、應用方法、過擬合問題等。最後介紹了生成式預訓練Transformer模型、Meta人工智能大語言模型等幾種常用的大語言模型。

作者簡介

他是培生集團斯里蘭卡公司的高級軟件架構師,擁有超過15年的行業經驗。他也是人工智能、機器學習、教育深度學習和計算機視覺領域的發明家、作家和研究員。蒂姆拉擁有斯里蘭卡科倫坡大學計算機科學理學碩士學位和信息技術學士學位。他也是TOGAF認證的企業架構師。他為在線學習平台申請了三項專利(動態神經網絡和語義學領域)。他出版了三本關於深度學習和計算機視覺的書。

目錄大綱

第1章 緒 論
1.1 人工智能簡史
1.2 大語言模型所處的地位
1.3 小結
第2章 自然語言處理的前世今生
2.1 自然語言處理的歷史
形式語法
轉換語法與生成語法
句法解析
語境與語義
語言理解
知識工程
概率模型
隱馬爾可夫模型
統計語言模型
最大熵模型
條件隨機場
大型注釋語料庫
詞義消歧
機器翻譯
信息檢索
統計方法
大型文本語料庫的可用性
自然語言處理任務的監督學習
命名實體識別
情感分析
詞嵌入簡介
深度學習與神經網絡
在現實世界的應用中部署
2.2 自然語言處理的任務
2.3 自然語言處理的基本概念
詞元化
語料庫與詞庫
詞嵌入
2.4 語言建模
N元語言模型
神經語言模型
2.5 小結
第3章 Transformer模型
3.1 注意力機制
3.2 Transformer架構
編碼器
解碼器
縮放點積
多頭注意力
3.3 小結
第4章 大語言模型大在哪?
4.1 如何使Transformer模型成為大語言模型
參數數量
數據規模
計算能力
微調和任務自適應
能力
為什麽參數很重要
計算需求
過擬合的風險
模型大小
數據的規模
4.2 大語言模型的類型
基於架構的分類
基於訓練目標的分類
基於使用的分類
4.3 基礎模型
在廣泛數據上進行預訓練
微調和靈活性
遷移學習
規模經濟
通用能力
微調功能
遷移學習
規模經濟
快速部署
跨學科應用
減少訓練開銷
持續適應性
人工智能的民主化
4.4 應用大語言模型
提示工程
微調
4.5 小結
第5章 流行的大語言模型
5.1 生成式預訓練Transformer模型
5.2 基於Transformer模型的雙向編碼器表示
5.3 Pathways語言模型
5.4 大語言模型Meta AI
5.5 小結
第6章 挑戰、機遇和誤區
6.1 大語言模型與超人工智能的挑戰
人工智能的級別
超人工智能帶來的人類存亡風險
大語言模型適用的場景
6.2 誤解與濫用
6.3 機遇
6.4 小結