基本术语
- 总体:研究对象的全体集合。
- 样本:从总体中抽取的部分个体。
- 抽样框:包含所有总体单位的名单或框架(如学生名册)。
- 参数:总体的特征值(如总体均值 μ)。
- 统计量:样本的特征值(如样本均值 x̄),用于估计参数。
- 抽样误差:样本统计量与总体参数之间的随机差异(概率抽样中可量化)。
- 非抽样误差:非随机因素导致的误差(如测量偏差、无回答)。
抽样方法的分类
(一)概率抽样
每个单位有已知的被选概率,可计算误差并推断总体。

-
简单随机抽样
- 每个样本被选概率相等(如抽签、随机数表)。
- 优点:理论简单,无偏差。
- 缺点:需完整抽样框,成本高;若总体差异大可能代表性不足。
-
系统抽样
- 按固定间隔(k)从排序的总体中抽取(如每10人选1人)。
- 优点:操作简便,样本分布均匀。
- 风险:若总体存在周期性,可能导致偏差。
-
分层抽样
- 将总体按特征分层(如年龄、地区),每层独立随机抽样。
- 优点:提高层内同质群体的代表性,减少误差。
- 关键:分层变量应与研究目标相关。
-
整群抽样
- 将总体分为群(如班级、社区),随机抽群,调查群内所有单位。
- 优点:降低成本,便于实施。
- 缺点:群内同质时误差较大,需更多样本量。
-
多阶段抽样
- 分多个阶段抽样(如先抽城市,再抽街道,最后抽户)。
- 优点:适用于大规模调查,灵活高效。
- 缺点:设计复杂,误差计算繁琐。
(二)非概率抽样
依赖主观判断,无法量化抽样误差,适用于探索性研究。
- 方便抽样:选取易获得的单位(如街头访问)。
- 判断抽样:根据专家经验选择典型样本。
- 配额抽样:按总体特征分配样本数量,非随机选择。
- 雪球抽样:通过已有样本推荐扩展样本(适用于隐蔽群体)。
抽样设计的关键原则
- 代表性:样本应充分反映总体结构。
- 随机性:概率抽样需保证随机选择以减少偏差。
- 可行性:兼顾成本、时间与操作难度。
- 精度要求:根据研究目标确定可接受的误差范围。
样本量确定因素
- 总体变异性:变异越大,所需样本越多。
- 置信水平:常用95%(对应Z值1.96)。
- 允许误差:期望的估计精度(如误差不超过5%)。
- 抽样设计:复杂设计需调整样本量(如设计效应)。
- 资源限制:时间、预算和人力。
常见误差与应对
- 抽样误差:通过增加样本量或改进设计(如分层)降低。
- 非抽样误差:
- 无回答误差:追踪或加权调整。
- 测量误差:优化问卷设计,培训调查员。
- 覆盖误差:确保抽样框完整更新。
应用场景
- 概率抽样:人口普查、社会调查、学术研究等需统计推断的场景。
- 非概率抽样:市场初探、案例研究、焦点小组等定性研究。
选择抽样方法需平衡科学性、成本与可行性,概率抽样支持统计推断,非概率抽样适合初步探索,实际工作中常结合多种方法(如分层整群抽样),并需严格质量控制以减少误差。
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。