優達學城數據分析師納米學位——第一課總結


從1月13號信誓旦旦的付款了第一位的納米學位到今天已經一周多的時間了,可以發現自己在完成任務的時候更多的在乎的是不是時間上達到了要求,而沒有過多的關注於實質的內容。有時候看到課程的小節數很多就有一種畏懼感和煩躁的心情,逐漸的說服自己取放棄,這其實是一種觀念上的偏差。可能是因為自己的性格比較急躁,很多事情都想要迅速的完成並且還能夠保證質量,但是實際來說,只要方法得當,最后的成果總會和你投入的時間成正比,放平心態,一步一步慢慢來。

下面對第一課所學的內容做一個梳理和總結。

研究方法 數據可視化 集中趨勢 可變性 歸一化 正態分布 抽樣分布 估計 假設檢驗 t檢驗 

BBC測量記憶力的實驗: 定義抽象概念,將一個抽象概念轉化成為一個具有實際操作性,可測性的變量

樣本與全體的不同,樣本能夠估計整體統計值,但是樣本一定會帶有一定的誤差,需要進行相關的分析和處理,樣本偏差,抽樣分布的結果可以確定某一樣本在整體中所占的位置,z值和t值來表示某一個特定值與平均值的差異

 

例子:安慰劑實驗檢測 單盲與雙盲的實驗不同

金色拱門理論:Mcdonald 開M的兩個國家都沒有參戰,關性不代表因果關系

 

數據可視化:

原始的數據集合 

經過初步整理的數據集合

 

 

例子:對Udacity學生的來源進行統計分析,

組距,頻率,相對頻率,百分比,占比,數值型的數據or類別性的數據,正偏斜分布(頻率低的值在X軸正方向)

 

3.集中趨勢:

眾數,中位數,平均值

4.差異值:

極差,偏差,平均偏差和,標准差,方差,4分之1值,樣本標准差(貝塞爾校正)

 

5.歸一化:

利用相對頻率引出概率密度函數正態分布的概念

 

 

例子:Andy的Facebook  katie的Twitter 歸一化是為了比較不同參考體系下的兩個個體 轉換為z值進行相關比較

6.正態分布:

7.抽樣分布:

例子:四面體骰子,投擲兩次,

 

t分布 如何引出t分布分概念,是否能夠將σ做為已知量帶入計算,t分布根據自由度的不同進行區分,自由度越大的t分布越接近於正態分布

 統計測試類型:

t檢驗 z檢驗

實驗設計類型: longitudinal 實驗 pretest-posttest實驗測試 相依樣本檢測實驗

單尾檢驗和雙尾檢驗的區別在於能否提前預判改變條件后因變量的變化方向,比如做一個葯物檢測,剛開始並不能夠確定葯物療效,可能加重病情也可能緩解病情,所以是雙尾檢測,如果是改善葯物,我們期望的是能夠進一步提高葯效,備擇假設是上界的單尾檢測。

Dependent samples are paired measurements for one set of items. Independent samples are measurements made on two different sets of items.


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM