【統計學】1.導論
其他課程的聯系
- 前置課程
- 概率論和數理統計
- 后續課程
- 數據分析等相關課程
- 教材
- 統計學(第七版)賈俊平
上機實驗
- Excel
- SPSS
學習方式
- 聽課
- 讀書、參考資料、課后習題
- 實驗相關內容
- 預習和復習
1.1 統計及其應用領域
1.2 統計數據的類型
1.3 統計學中的幾個基本概念
學習目標
1.理解統計學的含義
1.1.1 什么是統計學(statistics)
收集、處理、分析、解釋數據並從數據中得出結論的科學
收集數據:取得數據
處理數據:整理與圖表展示
分析數據:利用統計方法分析數據
數據解釋:結果的說明
得到結論:從數據分析中得出客觀結論
1.1.2 統計的應用領域
統計學應用於經濟學、醫學、管理學、工程學、社會學等領域
統計學為多個學科提供通用的數據分析方法
2.了解描述統計和推斷統計
描述統計(descriptive statistics)
1.研究數據收集、處理、匯總、圖表描述、概括與分析等統計方法
2.內容
- 搜集數據
- 整理數據
- 展示數據
- 描述性分析
3.目的
- 描述數據特征
- 找出數據的基本規律
推斷統計(inferential statistics)
1.研究如何利用樣本數據來推斷總體特征的統計方法
2.內容
- 參數估計
- 假設檢驗
3.目的
- 對總體特征做出判斷
3.了解統計學的應用領域
1.企業發展戰略
2.產品質量管理
3.市場研究
4.財務分析
5.經濟預測
6.人力資源管理
統計不是萬能的
一般來說,統計中的數據分析是從數據中找出啟發,而不是尋找支持某個結論的統計結果
統計方法可以幫助分析數據,但對統計結論做進一步的解釋,可能需要其他方面的專業知識
4.了解數據的基本類型
1.2.1 分類數據、順序數據、數值型數據
統計數據的分類
- 按計量層次
- 分類的數據(categorical data)
- 只能歸於某一類別的非數字型數據
- 對事物進行分類的結果,數據表現為類別,用文字來表述
- 例如,人口按性別分為男、女兩類
- 順序的數據(rank data)
- 只能歸於某一有序類別的非數字型數據
- 對事物類別順序的測度,數據表現為類別,用文字來表述
- 例如,產品分為一等品、二等品、三等品、次品等
- 數值型的數據(metric data)
- 按數字尺度測量的觀察值
- 結果表現為具體的數值,對事物的精確測度
- 例如:身高為 175cm、168cm、183cm
- 分類的數據(categorical data)
1.2.2 觀測數據和實驗數據
-
按收集方法
-
觀察的數據(observational data)
- 通過調查或觀測而收集到的數據
- 在沒有對事物人為控制的條件下得到的
- 有關社會經濟現象的統計數據幾乎都是觀測數據
-
實驗的數據(experimental data)
- 在實驗中控制實驗對象而收集到的數據
- 比如,對一種新葯療效的實驗,對一種新的農作物品種的實驗等
- 自然科學領域的數據大多數都為實驗數據
1.2.3 截面數據和時間序列數據
-
按時間狀況
-
截面的數據(cross-sectional data)
- 在相同或近似相同的時間點上收集的數據
- 描述現象在某一時刻的變化情況
- 比如,2010年在我國各地區的國內生產總值數據
-
時序的數據(time series data)
- 在不同時間上收集到的數據
- 描述現象隨時間變化的情況
- 比如,2010年至2020年國內生產總值數據
統計數據的分類作用
- 區分數據類型是十分重要的
- 不同類型的統計數據適用的數據分析方法不同
5.理解統計學中的幾個基本概念
1.3.1 總體和樣本
- 總體(population)
- 所研究的全部個體(數據)的集合,其中每一個個體也稱為元素
- 分為有限總體和無限總體
- 有限總體的范圍能夠明確確定,且元素的數目是有限的
- 無限總體所包括的元素是無限的,不可數的
- 樣本(sample)
- 從總體中抽取的一部分元素的集合
- 構成樣本的元素的數目稱為樣本容量或樣本量
1.3.2 參數和統計量
- 參數(parameter)
- 描述總體特征的概括性數字度量,是研究者想要了解的總體的某種特征值
- 所關心的參數主要有總體均值、標准差、總體比例等
- 總體參數通常用希臘字母表示
- 總體數據通常是不知道的,所以參數是一個未知的常數
- 統計量(statistic)
- 描述樣本特征的概括性數字度量,它是根據樣本數據計算出來的一些量,是樣本的函數
- 所關心的樣本統計量有樣本均值、樣本標准差、樣本比例等
- 樣本統計量通常用小寫英文字母來表示
- 樣本是已經抽出來的,所以統計量是一個自變量為樣本的函數
1.3.3 變量
- 說明現象某種特征的概念
- 如商品銷售額、受教育程度、產品的質量等級等
- 變量的具體表現稱為變量值,即數據
- 變量可以分為
- 分類變量(categorical variable)說明事物類別的名稱
- 順序變量(rank variable)說明事物有序類別的名稱
- 數值型變量(metric variable)說明事物數字特征的名稱
- 離散變量:取有限個值
- 連續變量:可以取無窮多個值
- 變量及其類型
- 基本分類
- 分類變量
- 順序變量
- 數字變量
- 其他分類
- 隨機變量/非隨機變量
- 經驗變量/理論變量
- 基本分類
本章小結
統計及其應用領域
統計數據的類型
統計中的幾個基本概念
隨堂練習
一項調查表明,消費者每月在網上購物的平均花費是200元,他們選擇在網上購物的主要原因是“價格便宜”,回答以下問題
1.這一研究的總體是什么?
網上購物的消費者或網上購物消費者的消費額
2.“消費者在網上購物的原因”是分類變量、順序變量還是數值變量,是離散型還是連續型?
分類變量,離散型
3.消費者每月在網上購物的平均花費是200元是參數還是統計量
統計量
4.研究者所使用的主要是描述統計方法還是推斷
推斷統計
