數據分析與機器學習(基於R語言) Just Enough R!: An Interactive Approach to Machine Learning and Analytics

Richard J. Roiger 畢冉

相關主題

商品描述

本書介紹了尺語言、機器學習算法、統計方法和分析方法,用於讓讀者瞭解如何在數據中找到有趣的結構,以及學會如何使用數據來解決覆雜問題。通過簡單、易懂的例子逐步解釋各種機器學習算法是如何獨立於任何編程語言工作的。本書詳細介紹了用R編寫的腳本,並將這些腳本應用於具有真實數據的覆雜問題。書中還提供了腳本代碼,允許讀者在學習時執行腳本,涵蓋了多種機器學習技術的不同實現方式。 本書既適合作為高校計算機及相關專業的教材,也適合作為IT技術人員的參考書。

作者簡介

理乍得·J.羅傑,明尼蘇達州立大學曼卡托分校的榮休教授,他在計算機與信息科學系從事教學和研究工作超過30年。羅傑博士於明尼蘇達大學獲得計算機與信息科學領域的博士學位。在機器學習和知識發現領域,他曾發表多篇會議論文和期刊論文。退休後,羅傑博士繼續擔任兼職教師,教授關於數據科學、人工智能和研究方法的課程。羅傑博士是明尼蘇達州退休教育協會的董事會成員,並擔任該協會的財務顧問。

目錄大綱

譯者序
前言
第1章 機器學習導論
1.1 機器學習、統計分析和數據科學
1.2 機器學習:第一個示例
1.2.1 屬性-值格式
1.2.2 用於診斷疾病的決策樹
1.3 機器學習策略
1.3.1 分類
1.3.2 估計
1.3.3 預測
1.3.4 無監督聚類
1.3.5 市場購物籃分析
1.4 評估性能
1.4.1 評估監督模型
1.4.2 二分類誤差分析
1.4.3 評估數值輸出
1.4.4 通過測量提升比較模型
1.4.5 評估無監督模型
1.5 倫理問題
1.6 本章小結
1.7 關鍵術語
練習題
第2章 R語言簡介
2.1 R語言和RStudio簡介
2.1.1 R的特性
2.1.2 安裝R
2.1.3 安裝RStudio
2.2 瀏覽RStudio
2.2.1 控制台
2.2.2 源面板
2.2.3 全局環境
2.2.4 包
2.3 數據在哪裡
2.4 獲取幫助和額外信息
2.5 本章小結
練習題
相關安裝包和函數總結
第3章 數據結構和操作
3.1 數據類型
3.1.1 字符數據和因子
3.2 單模式數據結構
3.2.1 向量
3.2.2 矩陣和數組
3.3 多模式數據結構
3.3.1 列表
3.3.2 數據框
3.4 編寫自己的函數
3.4.1 寫一個簡單的函數
3.4.2 條件語句
3.4.3 疊代
3.4.4 遞歸編程
3.5 本章小結
3.6 關鍵術語
練習題
相關安裝包和函數總結
第4章 準備數據
第5章 監督統計技術
第6章 基於樹的方法
第7章 基於規則的技術
第8章 神經網絡
第9章 正式評估技術
第10章 支持向量機
第11章 無監督聚類技術
第12章 案例研究:治療結果預測
附錄A 補充材料和更多數據集
附錄B 用於性能評估的統計數據
參考文獻