我有一個大學畢業生數據庫,想提取大約1000條記錄的隨機數據樣本。帶組的SQL隨機樣本
我要保證樣品的代表性人口的所以想包括相同比例的課程,例如
我能做到這一點使用下列內容:
select top 500 id from degree where coursecode = 1 order by newid()
union
select top 300 id from degree where coursecode = 2 order by newid()
union
select top 200 id from degree where coursecode = 3 order by newid()
但是我們有數百個課程代碼,因此這將非常耗時,我希望能夠針對不同的樣本大小重複使用此代碼,並且不特別想要通過查詢並對樣本大小進行硬編碼。
任何幫助,將不勝感激
如何確保我在樣本中得到正確的比例? –
你如何計算樣本量?它是基於人口比例嗎? –
樣本將用於調查問卷,因此樣本的大小取決於我們有多少預算..不是非常科學,我知道! –