Python數據分析

薛福亮、單春玲、李歡、韓瀛

  • 出版商: 清華大學
  • 出版日期: 2021-09-01
  • 定價: $294
  • 售價: 8.5$250
  • 語言: 簡體中文
  • 頁數: 189
  • 裝訂: 平裝
  • ISBN: 7302589992
  • ISBN-13: 9787302589990
  • 相關分類: Data Science
  • 下單後立即進貨 (約4週~6週)

  • Python數據分析-preview-1
  • Python數據分析-preview-2
  • Python數據分析-preview-3
Python數據分析-preview-1

相關主題

商品描述

作為一本學習Python數據分析的入門教程,本書系統地介紹了Python語言基礎和使用Python第三方庫進行數據分析、數據可視化、科學計算及機器學習等方面的知識。 本書共7章: 第1章介紹數據分析領域的基本理論和概念; 第2章介紹Python語言,包括基本語法、流程控制、組合數據類型及函數等內容; 第3章介紹Python科學計算基礎庫NumPy中各種數組運算和操作; 第4章介紹當前數據分析領域最主流的包Pandas; 第5章介紹使用Matplotlib和pyecharts進行數據可視化的知識; 第6章簡單介紹科學計算和機器學習的基本概念和方法; 第7章為綜合案例。 本書內容簡明易懂、重點突出、案例豐富。可作為高等院校信息管理與信息系統、數據科學及大數據技術等相關專業的本科生教材,也可作為Python數據分析初學者的參考書。

作者簡介

薛福亮,博士,天津財經大學管理科學與工程學院信息資源管理專業教師。主要研究方向為電子商務推薦、數據挖掘。 2009年9月-2010年3月美國加州州立大學富爾頓分校高級訪問學者。曾獲天津市優秀青年教師、天津市中青年骨干教師、天津市“131”創新型人才培養工程第三層次人選、天津財經大學十佳青年教師等稱號。近年來在核心期刊發表論文十餘篇,出版專著兩部、教材三部,主持和參與多項***、省部級課題。

目錄大綱

第1章數據分析概述
1.1什麼是數據分析
1.1.1數據的類型
1.1.2數據分析的過程
1.1.3與數據分析相關的概念
1.2為何用Python進行數據分析
1.2.1Python語言的特點
1.2.2Python在數據分析方面的優勢
1.3重要的Python庫
1.3.1NumPy
1.3.2SciPy
1.3.3Pandas
1.3.4Matplotlib
1.3.5pyecharts
1.3.6StatsModels
1.3.7scikit-learn
1.4Anaconda的安裝和使用
1.4.1Anaconda的下載
1.4.2Anaconda的安裝
1.4.3安裝和更新Python包
1.5JupyterNotebook的使用
1.5.1打開JupyterNotebook
1.5.2JupyterNotebook中代碼的編輯與運行
1.6本章小結

第2章Python程序設計基礎
2.1Python語言基礎
2.1.1對象、變量和標識符
2.1.2內置數據類型
2.1.3運算符和表達式
2.1.4Python中的函數和模塊
2.2流程控制
2.2.1順序結構
2.2.2選擇結構
2.2.3循環結構
2.3Python組合數據類型
2.3.1列表
2.3.2元組
2.3.3字符串
2.3.4字典
2.4函數
2.4.1函數的定義和調用
2.4.2函數參數和返回值
2.4.3lambda表達式
2.4.4遞歸函數
2.4.5函數式編程和高階函數
2.5本章小結

第3章NumPy基礎
3.1多維數組對象ndarray
3.1.1ndarray對象的創建
3.1.2ndarray對象的屬性
3.1.3隨機數數組
3.2數組的基本操作
3.2.1數組的索引和切片
3.2.2數組形狀變換
3.2.3數組轉置和軸對換
3.2.4數組的合併與拆分
3.3數組的運算
3.3.1數組運算和廣播機制
3.3.2數組的排序
3.3.3統計運算
3.3.4線性代數運算
3.4一個有趣的數組應用實例
3.5本章小結

第4章Pandas數據分析
4.1Pandas數據結構及創建
4.1.1Pandas數據結構概述
4.1.2創建Series數據結構
4.1.3創建DataFrame數據結構
4.2DataFrame基本操作
4.2.1基本列操作
4.2.2基本行操作
4.3Pandas檢索
4.3.1基本檢索
4.3.2多行檢索
4.3.3多列檢索
4.3.4行列檢索
4.3.5條件檢索
4.3.6重新檢索
4.3.7更換檢索
4.4Pandas數據運算
4.4.1算術運算
4.4.2排序
4.4.3函數應用和映射
4.4.4統計方法
4.5Pandas處理缺失值
4.5.1查找缺失值
4.5.2刪除缺失值
4.5.3填充缺失值
4.6數據載入與輸出
4.6.1讀/寫文本文件
4.6.2讀/寫Excel文件
4.7數據聚合與分組
4.7.1merge數據合併
4.7.2concat軸向連接
4.7.3檢測與處理重複值
4.7.4數據分組
4.8綜合案例
4.8.1背景介紹
4.8.2數據整理目標
4.8.3數據讀取與初步探索
4.8.4數據的清洗與整理
4.8.5數據查看
4.8.6數據的分組整理
4.8.7數據保存
4.9本章小結

第5章數據可視化
5.1Matplotlib可視化
5.1.1Matplotlib基本圖形 
5.1.2Matplotlib自定義設置
5.2pyecharts可視化
5.2.1pyecharts的安裝和使用
5.2.2pyecharts的常用圖形
5.3本章小結

第6章科學計算與機器學習
6.1SciPy科學計算庫
6.1.1SciPy簡介
6.1.2SciPy常量包
6.1.3SciPy積分
6.2scikitlearn機器學習庫
6.2.1線性回歸
6.2.2邏輯回歸
6.2.3k均值聚
6.3本章小結

第7章機器學習綜合案例
7.1“泰坦尼克”事件的生存率預測
7.1.1提出問題
7.1.2理解數據
7.1.3數據基本分析
7.1.4數據預處理
7.1.5邏輯回歸建模
7.2本章小結

參考文獻