分组减小了各抽样层变异性的影响,抽样保证了所抽取的样本具有足够的代表性。
下面,是一个实例应用:
某公司要估计某地家用电器的潜在用户。
这种商品的消费同居民收入水平相关,因而以家庭年收入为分层基础。
假定某地居民为1,000,000户,已确定样本数为1,000户,家庭年收入分10,000元以下,10,000——30,000元;30,000——60,000元,60,000元以上四层,其中收入在10,000元以下家庭户为180,000户,收入在10,000——30,000元家庭户为350,000户,收入在30,000——60,000元家庭户为3000,000户,收入在60,000元以下家庭户为170,000户,应进行如下抽样,如图:
分层抽样与简单随机抽样相比,往往选择分层抽样,因为它有显著的潜在统计效果。
也就是说,如果从相同的总体中抽取两个样本,一个是分层样本,另一个是简单随机抽样样本,那么相对来说,分层样本的误差更小些。
另一方面,如果目标是获得一个确定的抽样误差水平,那么更小的分层样本将达到这一目标。
总体中赖以进行分层的变量为分层变量,理想的分层变量是调查中要加以测量的变量或与其高度相关的变量。
分层的原则是增加层内的同质性和层间的异质性。
常见的分层变量有性别、年龄、教育、职业等。
分层随机抽样在实际抽样调查中广泛使用,在同样样本容量的情况下,它比纯随机抽样的精度高,此外管理方便,费用少,效度高。
3系统抽样
系统抽样也称为等距抽样、机械抽样、SYS抽样,它是首先将总体中各单位按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式。
是纯随机抽样的变种。
在系统抽样中,先将总体从1~N相继编号,并计算抽样距离K=N/n。
式中N为总体单位总数,n为样本容量。
然后在1~K中抽一随机数k1,作为样本的第一个单位,接着取k1+K,k1+2K……,直至抽够n个单位为止。
根据总体单位排列方法,系统抽样的单位排列可分为三类:按有关标志排队、按无关标志排队以及介于按有关标志排队和按无关标志排队之间的按自然状态排列。
按照具体实施等距抽样的作法,系统抽样可分为:直线系统抽样、对称系统抽样和循环系统抽样三种。
在定量抽样调查中,系统抽样常常代替简单随机抽样。
由于该抽样方法简单实用,所以应用普遍。
系统抽样得到的样本几乎与简单随机抽样得到的样本是相同的。
下面看一个例子,某产品的口味测试,需要运用等距抽样的方法从某校营销专业90名学生中抽选9名进行测试,如下图:
系统抽样方式也不是完美的,它相对于简单随机抽样方式最主要的优势就是经济性。
系统抽样方式比简单随机抽样更为简单,花的时间更少,并且花费也少。
使用系统抽样方式最大的缺陷在于总体单位的排列上。
一些总体单位数可能包含隐蔽的形态或者是“不合格样本”,调查者可能疏忽,把它们抽选为样本。
由此可见,只要抽样者对总体结构有一定了解时,充分利用已有信息对总体单位进行排队后再抽样,则可提高抽样效率。
4整群抽样
整群抽样又称聚类抽样。
是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。
应用整群抽样时,要求各群有较好的代表性,即群内各单位的差异要大,群间差异要小。
整群抽样优点是实施方便、节省经费;整群抽样的缺点是往往由于不同群之间的差异较大,由此而引起的抽样误差往往大于简单随机抽样。
例如,调查中学生患近视眼的情况,抽某一个班做统计;进行产品检验;每隔8h抽1h生产的全部产品进行检验等。
整群抽样与分层抽样在形式上有相似之处,但实际上差别很大。
分层抽样要求各层之间的差异很大,层内个体或单元差异小,而整群抽样要求群与群之间的差异比较小,群内个体或单元差异大;分层抽样的样本时从每个层内抽取若干单元或个体构成,而整群抽样则是要么整群抽取,要么整群不被抽取。
以上几种抽样方法的误差程度排序从大到小一般是:整群抽样、简单随机抽样、系统抽样、分层抽样。
5配额抽样
配额抽样也称“定额抽样”,是指调查人员将调查总体样本按一定标志分类或分层,确定各类(层)单位的样本数额,在配额内任意抽选样本的抽样方式。