大數據分析方法與應用

耿秀麗

  • 出版商: 機械工業
  • 出版日期: 2024-10-30
  • 定價: $354
  • 售價: 8.5$301
  • 語言: 簡體中文
  • 頁數: 304
  • ISBN: 7111763556
  • ISBN-13: 9787111763550
  • 相關分類: 大數據 Big-dataData Science
  • 下單後立即進貨 (約4週~6週)

商品描述

本書將理論與應用結合,介紹了大數據技術、大數據分析方法以及大數據倫理規範等基礎知識,可供讀者入門學習使用。本書共9章,包括大數據概述、數據分析基礎、回歸分析、聚類算法、推薦算法、文本挖掘、啟發式算法、支持向量機和神經網絡。各章都附有對應案例和習題,以幫助讀者理解和應用。 本書作為大數據公共通識課程的導論教材,為高校學生選修大數據課程編寫,主要面向大數據應用型人才培養,也可供相關技術人員參考。

目錄大綱

前言
第1章 大數據概述
1.1 大數據的相關概念
1.1.1 大數據的背景與來源
1.1.2 大數據的概念與特徵
1.1.3 大數據的數據類型
1.1.4 《“十四五”大數據產業發展規劃》與“5V”
1.2 對科學研究和經濟社會的影響
1.2.1 對科學研究的影響
1.2.2 對經濟社會的影響
1.2.3 大數據技術發展趨勢
1.3 大數據的研究現狀
1.4 大數據發展的機遇與挑戰
1.4.1 機遇
1.4.2 挑戰
1.5 大數據分析的相關概念
1.5.1 大數據分析的概念
1.5.2 大數據分析與傳統數據分析的比較
1.5.3 大數據分析的流程
1.5.4 大數據分析的基礎模型
1.6 大數據的應用
習題
參考文獻
第2章 數據分析基礎
2.1 數據的類型與分佈
2.1.1 總體和樣本
2.1.2 定性數據和定量數據
2.1.3 截面數據和時間序列數據
2.2 變量之間的關系
2.2.1 協方差
2.2.2 相關系數
2.3 數據的可視化——基於Excel的應用
2.3.1 散點圖
2.3.2 柱形圖和折線圖
2.3.3 數據透視表
2.4 數據的輸入
2.4.1 數據的輸入方法
2.4.2 數據有效性
2.4.3 條件函數IF
2.4.4 函數VLOOKUP
習題
第3章 回歸分析
3.1 線性和非線性回歸
3.1.1 線性回歸及其Excel中的實現
3.1.2 最小二乘回歸
3.1.3 非線性回歸及其Excel中的實現
3.2 多元回歸
3.2.1 多元回歸的概念
3.2.2 多重共線性
3.2.3 多元回歸及其SPSS中的實現
3.2.4 居民存款影響因素多元回歸案例分析
3.3 嶺回歸
3.3.1 嶺回歸的概念
3.3.2 嶺回歸及其在SPSS中的實現
3.3.3 居民存款影響因素嶺回歸案例分析
3.4 LASSO回歸
3.4.1 LASSO回歸的概念
3.4.2 LASSO回歸及其SPSS中的
實現
3.4.3 居民存款影響因素LASSO回歸案例分析
習題
參考文獻
第4章 聚類算法
4.1 聚類的原理
4.2 K-Means聚類
4.2.1 K-Means聚類算法的原理
4.2.2 K-Means聚類算法在MATLAB中的實現
4.3 K最近鄰算法
4.3.1 K最近鄰算法的原理
4.3.2 K最近鄰算法在MATLAB中的實現
4.3.3 鳶尾花分類案例分析
4.4 模糊C-均值算法
4.4.1 模糊C-均值算法的原理
4.4.2 模糊C-均值算法在MATLAB中的實現
4.4.3 用戶需求聚類案例分析
習題
參考文獻
第5章 推薦算法
5.1 協同過濾推薦算法
5.1.1 基於用戶的協同過濾算法
5.1.2 基於商品的協同過濾算法
5.1.3 案例分析1:二手汽車交易平臺推薦
5.1.4 案例分析2:著名電影推薦
5.2 協同過濾算法常見的問題以及對策
5.2.1 冷啟動問題及對策
5.2.2 稀疏性問題及對策
5.3 基於內容的推薦算法
5.3.1 基於結構化內容的推薦
5.3.2 基於非結構化內容的推薦
5.4 基於模型的推薦算法
5.5 基於關聯規則的推薦算法
5.6 信息隱私與基於隱私保護的方案推薦方法
5.6.1 信息隱私
5.6.2 基於隱私保護的方案推薦方法
5.7 信息污染與信任推薦算法
5.7.1 信息污染
5.7.2 信任推薦算法
5.8 信息繭房
習題
參考文獻
第6章 文本挖掘
6.1 文本挖掘的應用價值
6.2 文本挖掘的流程
6.2.1 文本挖掘的關鍵技術
6.2.2 文檔收集方法
6.2.3 分詞技術
6.2.4 詞的表示形式
6.2.5 文本特徵屬性處理
6.3 LDA主題模型
6.3.1 LDA主題模型介紹
6.3.2 吉布斯採樣
6.3.3 LDA主題模型訓練過程
6.4 基於LDA主題模型的客戶需求挖掘案例分析
習題
參考文獻
第7章 啟發式算法
7.1 啟發式算法的基本原理
7.1.1 啟發式函數
7.1.2 搜索策略
7.2 啟發式算法的類型
7.2.1 仿動物類啟發式算法
7.2.2 仿植物類啟發式算法
7.3 遺傳算法及其實現
7.3.1 遺傳算法的原理
7.3.2 遺傳算法的步驟
7.3.3 遺傳算法的計算機實現
7.4 粒子群算法及其實現
7.4.1 粒子群算法的原理
7.4.2 粒子群算法的步驟
7.4.3 粒子群算法的計算機實現
7.5 物流配送中心選址案例分析
習題
參考文獻
第8章 支持向量機
8.1 支持向量機的原理
8.1.1 支持向量機的由來
8.1.2 支持向量機的發展
8.2 支持向量機算法
8.2.1 支持向量機的模型算法
8.2.2 支持向量機模型優化算法
8.2.3 核函數
8.2.4 支持向量機算法的計算機實現
8.3 支持向量機算法參數優化
8.3.1 模糊支持向量機
8.3.2 最小二乘支持向量機
8.3.3 粒子群算法優化支持向量機
8.4 算法應用及案例分析
習題
參考文獻
第9章 神經網絡
9.1 發展歷程
9.2 基礎模型
9.2.1 神經