自然語言結構計算——BCC語料庫

荀恩東

  • 出版商: 人民郵電
  • 出版日期: 2023-01-01
  • 定價: $528
  • 售價: 8.5$449
  • 語言: 簡體中文
  • 頁數: 259
  • ISBN: 711559855X
  • ISBN-13: 9787115598554
  • 相關分類: Text-mining
  • 立即出貨

  • 自然語言結構計算——BCC語料庫-preview-1
  • 自然語言結構計算——BCC語料庫-preview-2
自然語言結構計算——BCC語料庫-preview-1

相關主題

商品描述

隨著電腦技術的發展,語料庫在語言本體與教學研究中發揮著越來越重要的作用,同時在大數據的背景下,最新的信息技術大大助力了語料庫的建設和應用。漢語語料庫的建設,近些年國內外都有較大的發展,BCC 漢語語料庫是其中使用比較多的之一,對漢語本體研究和與語言教學也發揮了重要作用。本書對BCC 漢語語料庫的特點、建設過程、檢索功能、查詢語言、編程語言以及對如何使用自定義BCC 語料庫進行介紹,以期更好地讓人理解,為語言本體與教學研究服務。

本書適合計算語言學與語言學本體研究的學者當作教材,也可作為高等院校人工智能相關的專業師生的教輔參考書。同時,也適合對語料庫建設與使用感興趣的相關人員閱讀。

作者簡介

荀恩东

北京语言大学信息科学学院院长,教授,博士生导师。汉语国际教育技术研发中心主任 ,教育部新世纪优秀人才,中国计算机学会名词专委会副主任,中国标准化研究院特聘研究员。1999毕业于哈尔滨工业大学计算机应用与科学系,获得计算机应用专业博士学位。1999年~2001年微软亚洲研究院副研究员。2001年~2003年通过"香港引入优秀人才计划",在香港科技大学工作。发表研究论文数十篇,主持多项国家863计划和国家自然科学基金项目,承担多项部委和公司合作的项目。目前研究领域包括:自然语言处理、计算机辅助语言学习技术研究和开发工作;非母语作文计算机水平自动评判;基于互联网多元信息作文辅助写作;汉字字形结构评判与辅助汉字书写练习研究;机器翻译。

目錄大綱

目錄

第 一章 緒論 4

1.1 語料庫簡介 4

1.1.1 基本特徵 4

1.1.2 發展歷程 6

1.2 語料庫類型 7

1.2.1 按語料模態分類 7

1.2.2 按語料語體分類 8

1.2.3 按語料狀態分類 8

1.2.4 按語料時間分類 8

1.2.5 按語料加工程度分類 9

1.2.6 按語料組織形式分類 9

1.2.7 按語料庫用途分類 10

1.3 語料庫技術 10

1.4 語料庫應用 12

1.4.1 服務對象 12

1.4.2 應用方式 14

1.5 BCC語料庫 15

1.6 本書章節介紹 16

第二章 BCC語料庫的建設 18

2.1 概述 18

2.2 BCC語料庫數據 21

2.2.1 數據概況 21

2.2.2 數據加工 22

2.3 BCC語料庫系統 34

2.3.1 構建索引 35

2.3.2 檢索語言 36

2.4 BCC語料庫服務 39

2.4.1 服務對象 39

2.4.2 服務方式 40

2.4.3 使用方式 43

第三章 BCC語料庫交互式查詢語言 46

3.1 概述 46

3.2 交互式查詢語言設計 46

3.2.1 序列語料的檢索式組成 47

3.2.2 結構語料的檢索式組成 49

3.3 交互式查詢語言功能 51

3.3.1 基本檢索 51

3.3.2 高級檢索 59

第四章 BCC語料庫交互式查詢語言應用 65

4.1 語素檢索 65

4.2 詞語檢索 67

4.2.1 基礎檢索 67

4.2.2 合成詞 71

4.2.3 離合詞 78

4.3 短語檢索 81

4.4 構式檢索 85

4.4.1 無變項構式的檢索 85

4.4.2 有變項構式的檢索 86

4.5 句子檢索 90

4.5.1 單句檢索 90

4.5.2 復句檢索 94

第五章 BCC語料庫腳本式編程語言 96

5.1 概述 96

5.2 檢索原理 96

5.2.1 檢索框架 97

5.2.2 檢索單元 100

5.3 BCC腳本式編程語言設計 110

5.3.1 基本查詢 112

5.3.2 組合查詢 115

5.3.3 條件約束 122

5.3.4 功能操作 131

5.3.5 輸出操作 137

5.4 BCC腳本式編程語言功能 141

5.4.1 基本檢索 142

5.4.2 組合檢索 146

5.4.3 高級檢索 151

第六章 BCC語料庫腳本式編程語言應用 157

6.1 概述 157

6.2 定中結構的抽取 157

6.2.1 限定詞性序列的檢索 157

6.2.2 限定結構標記的檢索 161

6.2.3 限定詞語範圍的檢索 163

6.2.4 限定語料特徵的檢索 164

6.2.5 限定檢索基點的檢索 167

6.3 小結 168

第七章 個性化語料庫的構建 170

7.1 數據準備 170

7.1.1 數據信息 170

7.1.2 數據預處理 171

7.2 索引構建 182

7.2.1 硬件基礎 182

7.2.2 預備文件 185

7.2.3 構建索引 189

7.3 語料庫使用 196

7.3.1 啟動服務 196

7.3.2 網絡使用 196

7.3.3 離線使用 204

第八章 BCC語料庫在線網站 208

8.1 概述 208

8.2 基礎檢索 208

8.2.1 檢索步驟 208

8.2.2 結果處理 210

8.3 歷時檢索 213

8.3.1 單檢索式 213

8.3.2 雙檢索式 214

8.4 對比檢索 215

8.4.1 單檢索式 215

8.4.2 雙檢索式 216

8.5 自選範圍檢索 217

8.6 詞典 218

8.6.1 簡介 218

8.6.2 查詢方式 221

8.6.3 查詢結果 223

參考文獻 228