網絡結構數據分析與應用
潘蕊,張妍,高天辰 著
- 出版商: 北京大學
- 出版日期: 2022-11-01
- 定價: $414
- 售價: 8.5 折 $352
- 語言: 簡體中文
- 頁數: 168
- 裝訂: 平裝
- ISBN: 7301333862
- ISBN-13: 9787301333860
-
相關分類:
Data Science
下單後立即進貨 (約4週~6週)
買這商品的人也買了...
相關主題
商品描述
當今社會,網絡結構數據普遍存在於各行各業。
如何從這些數據中挖掘出價值,並且解決實際問題,成為學界和業界共同關注的研究方向。
本書主要幫助讀者初步了解網絡結構數據,學習使用R語言進行實際數據分析
本書共七章。
第一章主要講解為什麼關心網絡結構數據,介紹了R語言及常用的包,同時整理了常用的網絡數據集。
第二章介紹了網絡結構數據的定義及分類,並整理了大量實例以幫助讀者快速熟悉網絡結構數據。
第三章講解了網絡結構數據的可視化,重點介紹了針對大規模網絡的可視化方法及網絡的動態交互式可視化。
第四章介紹了描述網絡特徵的各種統計量及重要的網絡結構,並給出了實例。
第五章重點介紹了三種經典的網絡結構數據模型,
第六章主要介紹了網絡結構數據中社區發現的相關概念及方法,並整理了常見的評價指標及標準數據集,
通過實例向讀者展示社區發現的應用場景。
第七章介紹了網絡結構數據分析中的鏈路預測問題。
本書適合網絡結構數據的初學者,相關專業的學生或對網絡結構數據感興趣的讀者閱讀。
作者簡介
潘蕊
中央財經大學統計與數學學院副教授,中央財經大學龍馬學者青年學者。
北京大學光華管理學院經濟學博士。
主要研究領域為高維數據分析、網絡結構數據分析、數據挖掘與建模等。
在Annals of Statistics、Journal of the American Statistical Association、《中國科學:數學》等國內外期刊發表論文多篇。
著有《數據思維實踐》。
張妍
女,廈門大學在讀博士研究生,研究方向為網絡結構數據。
高天辰
男,廈門大學在讀博士研究生,研究方向為複雜網絡分析。
目錄大綱
第1 章概述 1
1.1 為什麼關心網絡結構數據 2
1.2 R 語言與igraph 包3
1.3 本書所使用的案例數據 5
第2 章認識網絡結構數據 9
2.1 網絡結構數據的定義 10
2.2 網絡結構數據的分類 10
2.2.1 0-1 網絡11
2.2.2 加權網絡12
2.2.3 符號網絡14
2.2.4 雙模網絡15
2.2.5 動態網絡15
2.2.6 其他類型網絡16
2.3 更多例子 18
2.3.1 社交網絡18
2.3.2 貿易網絡19
2.3.3 疾病傳播網絡20
2.4 鄰接矩陣 20
2.5 網絡結構圖 22
2.6 igraph 包相關代碼示例 24
2.7 本章小結 30
第3 章網絡結構數據的可視化 32
3.1 佈局方式 33
3.2 裝飾網絡結構圖38
3.2.1 vertex.xxx 和edge.xxx 基礎參數設置39
3.2.2 vertex.xxx 和edge.xxx 階參數設置41
3.2.3 用V(G) 和E(G) 設置節點和連邊的屬性42
3.3 大規模網絡的可視化 44
3.3.1 提取核心子圖,將復雜網絡簡單化44
3.3.2 提取節點鄰域,繪製網絡子圖48
3.3.3 劃分網絡社區,展示網絡社區結構50
3.3.4 簡化網絡結構,以節點簇(社區)代替節點51
3.4 動態交互式網絡的可視化 53
3.5 其他的可視化軟件 56
3.6 本章小結 56
第4 章網絡的描述統計60
4.1 網絡密度 61
4.2 節點的度 63
4.2.1 無向網絡的度63
4.2.2 有向網絡的入度和出度65
4.3 二元結構 67
4.4 三元結構 70
4.5 路徑、距離、網絡的直徑 72
4.5.1 路徑72
4.5.2 距離與網絡的直徑74
4.6 節點的中心性 76
4.6.1 度中心性77
4.6.2 接近中心性77
4.6.3 中介中心性78
4.7 星狀結構與鄰居 80
4.8 案例:統計學科合作者網絡分析 82
4.9 本章小結 87
第5 章網絡結構數據的經典模型 88
5.1 ER 隨機圖模型 89
5.2 指數型隨機圖模型92
5.2.1 p1 模型92
5.2.2 馬爾可夫隨機圖模型94
5.2.3 新的擴展94
5.2.4 律師合作網絡示例96
5.3 隨機分塊模型 100
5.3.1 簡單隨機分塊模型100
5.3.2 度修正的隨機分塊模型104
5.3.3 其他擴展105
5.4 潛在空間模型 106
5.4.1 距離模型106
5.4.2 投影模型107
5.4.3 其他擴展107
5.5 本章小結 108
第6 章網絡結構數據的社區發現 109
6.1 社區發現的背景 110
6.1.1 社區的定義110
6.1.2 社區發現111
6.1.3 社區發現的分類112
6.2 常用的社區發現算法 113
6.2.1 GN 算法113
6.2.2 Fast greedy 117
6.2.3 Leading eigenvector 118
6.2.4 Infomap120
6.2.5 Label propagation 121
6.2.6 Multilevel 122
6.2.7 Walktrap 123
6.2.8 Spinglass 124
6.3 社區發現結果的評價 125
6.4 社區發現的拓展和應用 128
6.4.1 動態網絡社區發現128
6.4.2 帶有節點屬性的網絡社區發現130
6.5 案例:統計學科合作者網絡社區發現 130
6.6 本章小結 133
第7 章鏈路預測134
7.1 鏈路預測問題 135
7.2 基於相似性的鏈路預測135
7.2.1 基於鄰居的相似性指標136
7.2.2 基於路徑的相似性指標140
7.3 其他鏈路預測方法 141
7.4 預測效果評價 142
7.5 本章小結 145
附錄146
參考文獻150