Python數據挖掘技術及應用(第2版微課版)
蘇本躍 曹潔
- 出版商: 清華大學
- 出版日期: 2025-04-01
- 定價: $474
- 售價: 8.5 折 $403
- 語言: 簡體中文
- 頁數: 362
- ISBN: 7302684006
- ISBN-13: 9787302684008
下單後立即進貨 (約4週~6週)
商品描述
本書是一本全面介紹數據挖掘技術的專業書籍,系統地闡述了數據挖掘的相關概念、原理、算法思想和算法的Python代碼實現。全書共分為15章,各章相對獨立成篇,以利於讀者選擇性學習。15章內容分別為緒論、NumPy科學計算庫、pandas數據分析庫的數據結構、pandas數據讀寫與可視化、pandas數據整理、pandas數據分析、決策樹分類、貝葉斯分類、支持向量機分類和K近鄰分類、神經網絡分類、回歸、聚類、關聯規則挖掘、推薦系統、電商評論網絡爬取與情感分析等內容。 本書可作為高等院校各專業的數據挖掘、數據分析課程教材,也可作為數據挖掘、數據分析人員的參考書。
作者簡介
曹潔,博士,畢業於同濟大學電子與信息工程學院計算機軟件與理論專業;主要研究方向是並行分佈式處理、雲計算、大數據;主持和參與國家級、省部級項目5項;在《軟件學報》《計算機研究與發展》《通信學報》等國內外核心刊物上發表學術論文12篇;主講“Python語言程序設計”“大數據技術及應用”“雲計算技術”等課程;主編《Python語言程序設計》(微課版),參編《數據挖掘》《Struts2+Hibermate框架技術教程》(第2版)等多部教材
目錄大綱
第1章 緒論
1.1 什麽是數據分析
1.2 什麽是數據挖掘
1.3 數據挖掘的步驟
1.4 數據挖掘的典型應用
1.4.1 市場營銷
1.4.2 金融領域
1.4.3 醫療保健
1.4.4 社交媒體
1.4.5 教育領域
1.5 數據挖掘的主要挑戰
1.5.1 數據規模大
1.5.2 高維數據
1.5.3 隱私安全
1.5.4 概念漂移
1.5.5 倫理問題
習題
第2章 NumPy科學計算庫
2.1 ndarray多維數組
2.1.1 創建ndarray數組
2.1.2 創建特殊的ndarray數組
2.1.3 rLdarray對象的數據類型
2.1.4 ndarray對象的屬性
2.2 數組元素的索引、切片和選擇
2.2.1 索引和切片
2.2.2 選擇數組元素的方法
2.2.3 ndarray數組的形狀變換
2.3 隨機數數組
2.3.1 簡單隨機數
2.3.2 隨機分佈
2.3.3 隨機排列
2.3.4 隨機數生成器
2.4 數組的運算
2.4.1 算術運算與函數運算
2.4.2 統計計算
2.4.3 線性代數運算
2.4.4 排序
2.4.5 數組拼接與切分
2.5 讀寫數據文件
2.5.1 讀寫二進制文件
2.5.2 讀寫文本文件
習題
第3章 pandas數據分析庫的數據結構
3.1 Series結構
3.1.1 創建Series
3.1.2 查看和修改Series對象的數據
3.1.3 Series對象的常用屬性
3.1.4 Series對象的常用方法
3.1.5 Series對象的運算
3.2 DataFrame結構
3.2.1 創建DataFrame
3.2.2 DataFrame對象的屬性
3.3 讀取、修改和刪除DataFrame的數據
3.3.1 讀取DataFrame對象中的數據
3.3.2 修改DataFrame對象中的數據
3.3.3 刪除DataFrame對象中的數據
3.4 檢查DataFrame對象是否包含指定的值
習題
第4章 pandas數據讀寫與可視化
4.1 pandas讀寫CSV文件
4.1.1 讀取CSV文件中的數據
4.1.2 往CSV文件寫入數據
4.2 讀取TXT文件
4.3 讀寫Excel文件
4.3.1 讀取Excel文件中的數據
4.3.2 往Excel文件寫入數據
……
第5章 pandas數據整理
第6章 pandas數據分析
第7章 決策樹分類
第8章 貝葉斯分類
第9章 支持向量機分類和K近鄰分類
第10章 神經網絡分類
第11章 回歸
第12章 聚類
第13章 關聯規則挖掘
第14章 推薦系統
第15章 電商評論網絡爬取與情感分析
參考文獻