1. 總體與樣本 0x1:數理統計中為什么要引入總體和個體這個概念 概率論與數理統計中,一個很重要的研究對象就是總體的概率分布,理論上說,我們希望獲得被研究對象的總體樣本,基於這份總體樣本進一步研究其概率分布,但是遺憾地是,幾乎在100%的情況下,我們都不可能獲得真正的總體,我們只能獲取有限 ...
. 隨機變量的數字特征 x :為什么我們需要統計隨機變量的數字特征 隨機變量的分布函數 或概率函數,或密度函數 已經非常全面了,精確地描述了這個隨機變量取值的統計規律性,那為什么我們還需要研究隨機變量的數字特征呢 這個小節我們來討論一下這個話題。 . 實際問題背后概率分布函數的復雜性 在很多實際問題中 特別是一些具體的非物理的問題域 ,從實際問題場景中采樣得到的樣本集,一般時候都不會 符合一個經 ...
2019-07-07 16:13 5 601 推薦指數:
1. 總體與樣本 0x1:數理統計中為什么要引入總體和個體這個概念 概率論與數理統計中,一個很重要的研究對象就是總體的概率分布,理論上說,我們希望獲得被研究對象的總體樣本,基於這份總體樣本進一步研究其概率分布,但是遺憾地是,幾乎在100%的情況下,我們都不可能獲得真正的總體,我們只能獲取有限 ...
注:在統計學的應用中,參數估計和假設檢驗是最重要的兩個方面。參數估計是利用樣本的信息,對總體的未知參數做估計。是典型的“以偏概全”。 0. 參數及參數的估計 參數是總體分布中的參數,反映的是總體某方面特征的量。例如:合格率,均值,方差,中位數等。參數估計問題是利用從總體抽樣得到的信息 ...
3.2 回歸參數的估計 與一元線性回歸類似,我們需要對回歸參數進行估計。估計的方法一般有兩種,最小二乘估計和最大似然估計。 3.2.1 回歸參數的普通最小二乘估計 多元線性回歸方程未知參數 \(\beta_0\),\(\beta_1\),\(\cdots\),\(\beta_p ...
3.3 回歸參數估計量的性質 歸納回歸參數估計量的性質如下。 3.3.1 線性性 在多元線性回歸中,無論應用最小二乘估計還是最大似然估計,得到回歸參數向量 \(\hat{\bm{\beta}}\) 是隨機向量 \(\bm{y}\) 的一個線性變換,具體表示為 \[\hat{\bm ...
今天的主角是指數分布,由此導出\(\Gamma\)分布,同樣,讀者應嘗試一邊閱讀,一邊獨立推導出本文的結論。由於本系列為我獨自完成的,缺少審閱,如果有任何錯誤,歡迎在評論區中指出,謝謝! 目錄 Part 1:指數分布的參數估計 Part 2:獨立同分布指數分布之和 ...
非線性回歸是在對變量的非線性關系有一定認識前提下,對非線性函數的參數進行最優化的過程,最優化后的參數會使得模型的RSS(殘差平方和)達到最小。在R語言中最為常用的非線性回歸建模函數是nls,下面以car包中的USPop數據集為例來講解其用法。數據中population表示人口數,year表示年份 ...
注:點估計是參數估計中的一種。點估計常用的方法有兩種:矩估計和最大似然估計。之所以要做估計,最本質的問題是我們能獲得的信息量(樣本的數量)有限,因此只能在有限的信息中,用合理的方法、在可接受的精度或置信度下做近似計算,以便對總體有一個大概的認識,也就是將某種在有限樣本中獲得的規律,推廣到更大的樣本 ...
注:區間估計是除點估計之外的另一類參數估計。相對於點估計只給出一個具體的數值,區間估計能夠給出一個估計的范圍。 0. 點估計 vs 區間估計 根據具體樣本觀察值,點估計提供了一個明確的數值。但是這種判斷的把握有多大,點估計本身並沒有給出。區間估計就是為了彌補點估計的這種不足而提 ...