如何正確整理你的數據格式?


數據格式,直接影響着分析結果是否准確。小編最近也收到一些關於“數據格式”的提問,不知道自己的數據應該整理成什么格式上傳分析?

正好在這里統一分享幾種常見的數據格式,包括問卷數據、實驗數據、時序數據、面板數據以及一些特殊數據格式。希望今天的文章,能夠幫助你解決數據格式方面的困擾。

 

一、問卷數據

問卷數據是大家最常會用到的。此類數據的特點是:一行代表一個樣本,一列代表一個屬性。

 

 

這類格式攜帶着所有原始的數據信息,適用於各種分析方法。推薦大家將數據整理成此類格式。

 

多選題

問卷數據可能涉及多選題錄入。單選題錄入就是簡單的一個問題為一列。根據答題者的選項,選擇哪個選項就把相應的序號填入即可。

 

 

錄入多選題時,要將多選題每一個選項看作一個單選題。選擇錄入為1,不選擇錄入為0。有幾個選項就要錄入幾列。

 

開放題

除了單選題、多選題,問卷研究中還有一類開放題型,如填空題。

文本格式系統無法直接分析。如果是在問卷平台中生成的數據,建議大家導出[數字格式]的數據,再上傳到系統進行分析。

 

 

如果是手動錄入,建議先在EXECL里整理,把意思相近的答案歸為一類提取出關鍵詞表示,這樣后續可以采用頻數、詞雲分析等。

 

詞雲

 

二、實驗數據

實驗數據常見有兩種:一種是加權數據格式,一種是配對數據格式。

加權數據格式,這類數據常見於醫學研究中。此類數據是整理的匯總統計數據,不能直接分析。一定要先進行加權處理。

 

 

加權數據的特點是數據中一定有:兩個變量(“組別”和“療效”)各占一列,還有一列表示頻數(加權項)。

分析時,需將加權項放入加權項【可選】框里。

 

 

 

所有數據中,只有定類數據才能整理成加權格式,因此,這類數據只能應用在一部分研究方法上。SPSSAU中支持加權數據的研究方法包括如下:

 

 

配對數據格式,常見於配對實驗設計中,涉及的研究方法包括配對t 檢驗,配對卡方等。可比較實驗組和對照組數據的差異或干預前后數據的差異。

 

 

配對數據的特點為:行數一定完全相等並且只有兩列。分析時一定要特別注意。

 

三、時間序列數據

時間序列數據的格式包括時間和實際分析項共兩列。此類數據有明顯的時間順序,且順序不能更改,一定是從上至下日期遞增,中間不能有間隔。

 

 

 

四、面板數據

面板模型是針對面板數據進行分析,面板數據是一種特殊的數據格式。

這類數據的特點是可以同時取得時間和個體兩個維度的數據。

 

 

 

使用SPSSAU進行分析時,需要注意錄入個體ID(公司編號)和時間(年份)這兩列數據。

個體ID’就是上圖中的‘公司編號’,‘時間’就是‘年份’。‘公司編號’和‘年份’兩項共同用於提示系統當前為面板數據。

 

五、特殊數據格式

還有一些比較特殊的數據格式。如綜合評價里的模糊綜合評價、灰色關聯法等。

 

 
模糊綜合評價數據格式

 

 
灰色關聯法數據格式

 

建議使用這些方法之前,參考幫助手冊中的格式說明或視頻教程。

同時幫助手冊中也提供了多種數據格式說明,大家可以直接搜索進行查看。

 

 

-END-


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM