抽樣調查的領域涉及如何用有效的方式得到樣本。這些調查都利用了問卷,而問卷的設計則很有學問。它設計如何用詞、問題的次序和問題的選擇與組合等等。涉及包括心理學、社會學等知識。問題的語言應該和被調查者的文化水平相適應。那么抽樣調查的設計的目的之一是確保樣本對總體的代表性,以保證后續推斷的可靠性。然而每個個體可能的簡單隨機抽樣是一個理想情況。
概率抽樣方法 假定每個個體出現在樣本中的概率是已知的。這種概率相抽樣方法使得數據能夠進行合理的統計推斷。
非概率抽樣方法 對從非概率抽樣得到的數據進行推斷,它依賴於具體的抽樣方案是如何設計的,也依賴於它是如何實施的。
那么概率抽樣方法有哪些呢:
1、系統抽樣 也成為每N個名字選擇方法(n-th name selection technique),這是先把總體中的每個單元編號,然后隨機選取其中之一作為抽樣的開始點進行抽樣。根據預定的樣本量決定"距離"→N,在選取開始點之后,通常從開始點開始按照編號進行所謂等距抽樣。 比如 起始點為5,"距離" N = 10,則下面的抽查對象為15號、25號等等。如果編號是隨機選取的,則這和簡單隨機抽樣就是等價的了。
2、分層抽樣 是簡單隨機抽樣的一個變種,先把要研究的總體分成相對相似或相對齊次的個體組成的類,再在各類中分別抽取簡單隨機樣本。然后把從各類中得到的結果匯總,並對總體進行判斷。這里在每類中調查的人數通常是按照該類人的比例,但出於各種考慮,也可能不按照比例,也可能需要加權。(加權的概念:在求若干項的和時,對各項乘以不同的系數,這些系數的和通常為1)
3、整群抽樣 是先把總體划分成若干群,和分層抽樣不同之處在於,這里的群是由不相似或異類的個體組成的,在單級整群抽樣中,先(通常是隨機的)從這些群中抽取幾群,然后再在這些抽取的群中對個體進行全面調查。在兩極整群抽樣中,先(通常是隨機地)從這些群中抽取幾個群,然后再在這些抽取的群中對個體做簡單隨機抽樣。適用於區域抽樣,比如對某縣的各個村子進行調查,顯然這些村子的情況差異不大,否則就會增大誤差。主要應用在於區域抽樣,群是以區域進行划分的。
4、多級抽樣 在群體很大時,往往在抽取若干群之后,再在其中抽取若干子群,甚至再在子群中抽取子群,等等。 這個在每一級都可能再采用不同的抽樣方法,所以比較復雜,也稱為多級混合型抽樣。
非概率抽樣方法有哪些呢:
1、目的抽樣 由研究人員主觀地選擇對象。那么樣本多少依賴於與預先就有的知識。
2、方便抽樣 通常用於初期的評估。比如,為了調查游客的意見,可能選擇不同的時間和旅游景點,隨意對願意停下的游客進行調查。這看起來可能是隨機的,其實並不是。
3、判斷抽樣 憑經驗來判斷選擇樣本,通常是方便抽樣的延伸。這種比如 研究各縣的情況,而研究人員僅在一個縣中抽樣,那么這個縣就具有代表性。
4、定額抽樣 先是確定各類及比例(與分層抽樣類似),然后利用方便抽樣或判斷抽樣來按比例選取需要的個體數。
5、雪球抽樣 用於感興趣的樣本特征較稀有的情況,比如吸毒者,你想調查一個和吸毒者有關的人,然后這個人就會介紹你找到相關的人,可能會產生較大誤差。 依賴於一個目標推薦另一個目標的方法。
6、自我選擇 是讓個體自願參加調查。
總的來說,科學的數據抽樣方法很多,但是往往是各種抽樣方法的組合,因為既要考慮精度又要考慮方便性、可行性等。