試閱

Python數據分析基礎: 包含數據挖掘和機器學習

者:
期:
2019/07/24
9
680612
從統計學出發,最實用的Python工具書。
◆全書基於Python3.6.4編寫,兼容性高,為業界普遍使用之版本。
◆以簡明文字闡述替代複雜公式推導,力求降低學習門檻。
◆簡單易懂,理論完整,案例詳盡。
◆包含AI領域熱門的深度學習、神經網路及統計思維的數據分析,洞察市場先機。

內容簡介

從統計學出發,最實用的Python工具書。
◆全書基於Python3.6.4編寫,兼容性高,為業界普遍使用之版本。
◆以簡明文字闡述替代複雜公式推導,力求降低學習門檻。
◆簡單易懂,理論完整,案例詳盡。
◆包含AI領域熱門的深度學習、神經網路及統計思維的數據分析,洞察市場先機。

Python,是當今大數據時代下最為流行的編程工具之一;資料分析,則是在科學研究中日益重視的環節。當開源語言的便利性,遇上統計思維的重要性,本書便應運而生。

本書從基礎統計學出發,是初學者的Python實用書籍。從統計學的視角和需求來寫Python的應用,有很多運用Stats Model和SciPy來進行統計分析的案例,對於具統計背景的人學習Python很有幫助!

針對當前人工智慧領域較為熱門的「深度學習」亦有所涉獵。介紹神經網路與深度學習的基本思想、架構及步驟,並利用TensorFlow架構工具解決實際案例。是一本適合對Python和統計學有興趣的讀者、相關研究者以及企業決策者的工具書。

產品目錄

第1 版前言
第2 版前言

Chapter01 Python 程式設計基礎
1.1 Python 系統組態
1.2 Python 基礎知識
1.2.1 幫助
1.2.2 識別字
1.2.3 行與縮進
1.2.4 變數與物件
1.2.5 數字與運算式
1.2.6 運算子
1.2.7 字串
1.2.8 日期和時間
1.3 資料結構與序列
1.3.1 列表
1.3.2 元組
1.3.3 字典
1.3.4 集合
1.3.5 推導式
1.4 語句與控制流
1.4.1 條件陳述式
1.4.2 迴圈語句
1.5 函數
1.5.1 函數的參數
1.5.2 全域變數與區域變數
1.5.3 匿名函數
1.5.4 遞迴和閉包
1.5.5 柯里化與反柯里化
1.5.6 常用的內建高階函數
1.6 反覆運算器、生成器和裝飾器
1.6.1 反覆運算器
1.6.2 生成器
1.6.3 裝飾器

Chapter02 Python 程式設計進階
2.1 類
2.1.1 聲明類
2.1.2 方法
2.1.3 屬性
2.1.4 繼承
2.1.5 特性
2.2 異常捕獲與容錯處理
2.2.1 錯誤和異常
2.2.2 異常處理
2.3 模組
2.4 軟體套件
2.4.1 軟體套件的組成與使用
2.4.2 常用資料分析工具庫
2.5 文件I/O
2.6 多核心平行計算
2.6.1 多進程
2.6.2 並行

Chapter03 數據預處理
3.1 numpy 基礎
3.1.1 向量
3.1.2 陣列

3.1.4 文件讀寫
3.2 pandas 基礎
3.2.1 pandas 的資料結構
3.2.2 pandas 的資料操作

Chapter04 資料描述
4.1 統計量
4.1.1 集中趨勢
4.1.2 離散程度
4.1.3 分布形狀
4.2 統計表
4.2.1 統計表的基本要素
4.2.2 統計表的編製

Chapter05 統計圖形與視覺化
5.1 matplotlib 基本繪圖
5.1.1 函數繪圖
5.1.2 圖形基本設置
5.1.3 物件導向繪圖
5.1.4 繪圖樣式
5.2 pandas 基本繪圖
5.3 基本統計圖形
5.3.1 折線圖
5.3.2 面積圖
5.3.3 長條圖
5.3.4 橫條圖
5.3.5 龍捲風圖
5.3.6 圓形圖
5.3.7 階梯圖
5.3.8 箱形圖
5.3.9 小提琴圖
5.3.10 散點圖
5.3.11 氣泡圖
5.3.12 六邊形箱形圖
5.3.13 雷達座標圖
5.3.14 輪廓圖
5.3.15 調和曲線圖
5.3.16 等高線圖
5.3.17 極座標圖
5.3.18 文字雲
5.3.19 資料地圖
5.4 其他繪圖工具

Chapter06 簡單統計推斷
6.1 簡單統計推斷的基本原理
6.1.1 資料分布
6.1.2 參數估計
6.1.3 假設檢驗
6.2 單總體參數的估計及假設檢驗
6.2.1 單總體的參數估計
6.2.2 單總體參數的假設檢驗
6.3 兩總體參數的假設檢驗
6.3.1 獨立樣本的假設檢驗
6.3.2 成對樣本的假設檢驗

Chapter07 方差分析
7.1 方差分析的基本原理
7.2 一元方差分析
7.2.1 一元單因素方差分析
7.2.2 一元多因素方差分析
7.3 協方差分析

Chapter08 非參數檢驗
8.1 非參數檢驗的基本問題
8.2 單樣本非參數檢驗
8.2.1 中位數(平均值)的檢驗
8.2.2 分布的檢驗
8.2.3 連串檢定
8.3 兩個樣本的非參數檢驗
8.3.1 獨立樣本中位數比較的Wilcoxon 秩和檢驗
8.3.2 獨立樣本的分布檢驗
8.3.3 成對(匹配)樣本中位數的檢驗
8.3.4 兩樣本的連串檢定
8.4 多個樣本的非參數檢驗
8.4.1 多個樣本的分布檢驗
8.4.2 獨立樣本位置的檢驗

Chapter09 相關分析與關聯分析
9.1 相關分析
9.1.1 函數關係與相關關係
9.1.2 簡單相關分析
9.1.3 偏相關分析
9.1.4 點二列相關分析
9.1.5 非參數相關分析
9.2 關聯分析
9.2.1 基本概念與資料預處理
9.2.2 Apriori 演算法
9.2.3 FP-growth 演算法

Chapter10 迴歸分析
10.1 線性迴歸
10.1.1 迴歸分析的基本原理
10.1.2 一元線性迴歸
10.1.3 多元線性迴歸
10.1.4 含有定性引數的線性迴歸
10.2 非線性迴歸
10.2.1 可線性化的非線性分析
10.2.2 非線性迴歸模型
10.3 多項式迴歸
10.4 分位數迴歸

Chapter11 離散因變數模型
11.1 線性機率模型
11.2 二元選擇模型
11.2.1 線性機率模型的缺陷與改進
11.2.2 二元選擇模型的基本原理
11.2.3 BINARY PROBIT 模型
11.2.4 BINARY LOGIT 模型
11.3 多重選擇模型
11.4 計數模型

Chapter12 主成分與因素分析
12.1 數據降維
12.1.1 資料降維的基本問題
12.1.2 數據降維的基本原理
12.2 主成分分析
12.2.1 主成分分析的基本概念與原理
12.2.2 主成分分析的基本步驟和過程
12.3 因素分析
12.3.1 因素分析的基本原理
12.3.2 因素分析的基本步驟和過程

Chapter13 列聯分析與對應分析
13.1 列聯分析
13.1.1 列聯表
13.1.2 列聯表的分布
13.1.3 χ2 分布與χ2 檢驗
13.1.4 χ2 分布的期望值準則
13.2 對應分析
13.2.1 對應分析的基本思想
13.2.2 對應分析的步驟和過程

Chapter14 聚類
14.1 聚類的基本原理
14.1.1 聚類的基本原則
14.1.2 單一指標的系統聚類過程
14.1.3 多指標的系統聚類過程
14.2 聚類的步驟和過程
14.2.1 系統聚類
14.2.2 K-MEANS 聚類
14.2.3 DBSCAN 聚類

Chapter15 判別和分類
15.1 判別和分類的基本思想
15.1.1 判別
15.1.2 分類
15.1.3 效果評估
15.2 常用判別方法和分類演算法
15.2.1 距離判別和線性判別
15.2.2 貝葉斯判別
15.2.3 k- 近鄰
15.2.4 決策樹
15.2.5 隨機森林
15.2.6 支持向量機

Chapter16 神經網路與深度學習
16.1 神經網路
16.1.1 基本概念與原理
16.1.2 感知機
16.1.3 多層神經網路
16.2 深度學習
16.2.1 基本概念與原理
16.2.2 卷積神經網路
16.2.3 Tensorflow

Chapter17 時間序列分析
17.1 時間序列的基本問題
17.1.1 時間序列的組成部分
17.1.2 時間序列的平穩性
17.2 ARIMA 模型的分析過程
17.2.1 ARIMA 模型
17.2.2 ARMA 模型的識別、估計與預測

附錄:各章圖形

作者介紹

阮敬

阮敬(1979.10),博士,教授,博士生導師。現任首都經濟貿易大學研究生院副院長,北京市豐台區政協委員。兼任中國消費者協會專家委員會委員、中國青年統計學家協會創始秘書長、中國現場統計研究會副秘書長兼經濟與金融統計分會副理事長、中國統計教育學會常務理事兼高等教育分會秘書長、中國商業統計學會常務理事兼數據科學與商業智慧分會學術委員會副主任、全國工業統計學教學研究會常務理事、北京大數據協會副秘書長等職。



近年來主持國家社科基金、教育部人文社科基金、北京市自然科學基金、北京市社科基金、留學人員擇優資助基金等科研項目和世界500強企業及大型國企、國家部委及北京市政府部門等橫向課題共50餘項。



在國內外公開發表論文50餘篇,出版專著、譯著和教材12部,先後14次榮獲國務院學位委員會全國應用統計專業學位研究生教育指導委員會優秀教育教學成果獎、全國統計科學研究優秀成果獎、北京市哲學社會科學優秀成果獎、北京市統計科學研究優秀成果獎、北京市優秀調查研究成果獎等科研和教學獎勵。本書曾入選「十三五全國統計規劃教材」。

規格

誠品貨碼 / 2681793670007
ISBN13 / 9789577634467
ISBN10 / 957763446X
EAN貨碼 / 9789577634467
頁數 / 592
開數 / 16K
注音版 / 否
裝訂 / P:平裝
語言 / 1:中文/繁體
級別 / N:無

退貨說明

退貨須知:

  1. 依照消費者保護法的規定,您享有商品貨到次日起七天猶豫期(含例假日)的權益(請注意!猶豫期非試用期),辦理退貨之商品必須是全新狀態(不得有刮傷、破損、受潮)且需完整(包含全部商品、配件、原廠內外包裝、贈品及所有附隨文件或資料的完整性等)。
  2. 請您以送貨廠商使用之包裝紙箱將退貨商品包裝妥當,若原紙箱已遺失,請另使用其他紙箱包覆於商品原廠包裝之外,切勿直接於原廠包裝上黏貼紙張或書寫文字。若原廠包裝損毀將可能被認定為已逾越檢查商品之必要程度,本公司得依毀損程度扣除回復原狀必要費用(整新費)後退費;請您先確認商品正確、外觀可接受,再行拆封,以免影響您的權利;若為產品瑕疵,本公司接受退貨。

依「通訊交易解除權合理例外情事適用準則」,下列商品不適用七日猶豫期,除產品本身有瑕疵外,不接受退貨:

  1. 易於腐敗、保存期限較短或解約時即將逾期。(如:生鮮蔬果、乳製品、冷凍冷藏食材、蛋糕)
  2. 依消費者要求所為之客製化給付。(如:客製印章、鋼筆刻字)
  3. 報紙、期刊或雜誌。
  4. 經消費者拆封之影音商品或電腦軟體。
  5. 非以有形媒介提供之數位內容或一經提供即為完成之線上服務,經消費者事先同意始提供。(如:電子書)
  6. 已拆封之個人衛生用品。(如:內衣褲、襪類、褲襪、刮鬍刀、除毛刀等貼身用品)
  7. 國際航空客運服務。

若您退貨時有下列情形,可能被認定已逾越檢查商品之必要程度而須負擔為回復原狀必要費用(整新費),或影響您的退貨權利,請您在拆封前決定是否要退貨:

  1. 以數位或電磁紀錄形式儲存或著作權相關之商品(包含但不限於CD、VCD、DVD、電腦軟體等) 包裝已拆封者(除運送用之包裝以外)。
  2. 耗材(包含但不限於墨水匣、碳粉匣、紙張、筆類墨水、清潔劑補充包等)之商品包裝已拆封者(除運送用之包裝以外)。
  3. 衣飾鞋類/寢具/織品(包含但不限於衣褲、鞋子、襪子、泳裝、床單、被套、填充玩具)或之商品缺件(含購買商品、附件、內外包裝、贈品等)或經剪標或下水或商品有不可回復之髒污或磨損痕跡。
  4. 食品、美容/保養用品、內衣褲等消耗性或個人衛生用品、商品銷售頁面上特別載明之商品已拆封者(除運送用之包裝外一切包裝、包括但不限於瓶蓋、封口、封膜等接觸商品內容之包裝部分)或已非全新狀態(外觀有刮傷、破損、受潮等)與包裝不完整(缺少商品、附件、原廠外盒、保護袋、配件紙箱、保麗龍、隨貨文件、贈品等)。
  5. 家電、3C、畫作、電子閱讀器等商品,除商品本身有瑕疵外,退回之商品已拆封(除運送用之包裝外一切包裝、包括但不限於封膜等接觸商品內容之包裝部分、移除封條、拆除吊牌、拆除貼膠或標籤等情形)或已非全新狀態(外觀有刮傷、破損、受潮等)與包裝不完整(缺少商品、附件、原廠外盒、保護袋、配件紙箱、保麗龍、隨貨文件、贈品等)。
  6. 退貨程序請參閱【客服專區→常見問題→誠品線上退貨退款】之說明。
付款/配送