數據素養:人工智能如何有據可依

龔超、鄭子傑、汪輝著

  • 出版商: 化學工業
  • 出版日期: 2023-07-01
  • 定價: $419
  • 售價: 8.5$356
  • 語言: 簡體中文
  • 頁數: 222
  • 裝訂: 平裝
  • ISBN: 7122434974
  • ISBN-13: 9787122434975
  • 相關分類: Data ScienceMachine Learning
  • 立即出貨 (庫存=1)

買這商品的人也買了...

商品描述

“人工智能超入門叢書”面向人工智能各技術方向零基礎的讀者,內容涉及數據思維、機器學習、視覺感知、
情感分析、搜索算法、強化學習、知識圖譜、專家系統等方向,輔以程序代碼解決問題,幫助讀者快速入門。
《數據素養:人工智能如何有據可依》是“人工智能超入門叢書”中的分冊,主要講解數據的重要性,
重點解讀處理數據的各種方法,培養讀者的數據素養和數據思維。
具體內容包括數據規律、數據收集、數據清洗、數據可視化,以及特徵構建、圖像處理、文本分析等,
同時在本書後一章,分析了各個學科中如何運用數據思維處理問題。
本書內容通俗易懂,可以作為人工智能及計算機相關工作崗位技術人員的入門讀物,
對數據及人工智能方向感興趣的人群也可以閱讀。

作者簡介

龔超,日本工學博士,清華大學日本研究中心主任助理,深圳清華大學研究院下一代因特網研發中心核心成員,未來基因(北京)人工智能研究院首席專家,教育部教育信息化教學應用實踐共同體項目特聘專家。中國人工智能學會中小學工作委員會委員,中國自動化學會普及工作委員會委員。研究方向為人工智能優化算法,人工智能在數字化轉型中的應用等。多家500強企業數字化轉型領域高級顧問,在國內外期刊上發表文章共計60餘篇。

目錄大綱

第1章 數據概述
1.1 數字化社會與數據思維
1.1.1 數字的社會早已到來
1.1.2 人人都該提升數據素養
1.1.3 化無形為有形,化抽象為具體
1.2 數據的含義與類型劃分
1.2.1 數據的狹義含義
1.2.2 數據的廣義含義
1.2.3 數據類型的劃分
1.3 人工智能與數據
1.3.1 新時代的金礦——數據
1.3.2 將數據轉化為洞見
1.3.3 警惕選擇偏見與數據偏見
第2章 隨機世界中的數據規律
2.1 隨機現象
2.1.1 生活中的隨機現象
2.1.2 隨機試驗
2.2 隨機變量與數據中的隨機
2.2.1 隨機變量及其分佈
2.2.2 數據中的隨機性
2.3 數據的形態與中心極限定理
2.3.1 正態分佈
2.3.2 中心極限定理
第3章 數據收集與整理
3.1 如何獲取數據
3.1.1 獲取一手數據
3.1.2 獲取二手數據
3.2 “二維”視角看數據
3.2.1 二維表
3.2.2 二維表的基本操作
3.3 如何清洗數據
3.3.1 數據的格式化與結構化
3.3.2 缺失值與異常值
第4章 數據的描述與可視化
4.1 數據的集中、離中趨勢
4.1.1 數據的集中趨勢
4.1.2 數據的離中趨勢
4.2 數據的變換
4.2.1 數據的無量綱化
4.2.2 連續型變量的變換
4.2.3 類別特徵的變換
4.3 數據的可視化
4.3.1 科學繪圖
4.3.2 可視化的重要性
4.3.3 數據形態看數據
第5章 特徵的構建與關聯
5.1 特徵的創建與選取
5.1.1 特徵的創建
5.1.2 與時俱進選取指標
5.2 特徵的擴充與降維分析
5.2.1 特徵的擴充
5.2.2 降維分析
5.3 特徵間的關系
5.3.1 相關≠因果
5.3.2 相關系數
5.3.3 從相關到回歸
第6章 非結構化數據的結構化
6.1 用“二維表”的結構理解數據
6.2 圖像即矩陣
6.2.1 用矩陣視角打開圖像
6.2.2 圖像特徵的處理
6.3 文本的向量之路
6.3.1 文本的分詞、清洗與整理
6.3.2 從句子到向量的詞袋模型
6.3.3 Word2Vec讓詞語變向量
第7章 無數據,不課堂
7.1 數據與算法,打開另一扇窗
7.1.1 語文——水滸傳
7.1.2 物理——伏安法測電阻
7.1.3 生物——鳶尾花分類
7.2 可視化,讓內容更加圖強
7.2.1 數學——二次函數性質分析
7.2.2 英語——I have a dream
7.2.3 化學——繪制元素周期表
7.2.4 歷史——中國歷史人口數據可視化
7.2.5 地理——衛星影像圖
附錄
附錄一 抽樣分佈與參數估計
附錄二 假設檢驗
附錄三 騰訊扣叮Python實驗室:Jupyter Lab使用說明