一、核心概念，什么是样本量？

星博讯 AI基础认知 2026-04-09 33

核心思想：由于研究整个总体（普查）通常成本过高、时间太长或不可能实现，我们通过研究一个精心挑选的“样本”来推断总体的特征，样本量就是决定这个推断有多可靠的关键因素之一。

一、核心概念，什么是样本量？-第1张图片-星博讯网络科技知识-SEO优化技巧|AI知识科普|互联网行业干货大全

为什么样本量很重要？（“权衡的艺术”）

样本量不是随便定的,它直接影响到研究的三个核心方面：

估计的精确度：样本量越大，样本统计量（如平均值、比例）的抽样误差通常越小，置信区间越窄，你对总体参数的估计就越精确。
- 例子：调查手机使用时间，调查10个人得出的平均时间，和调查1000个人得出的平均时间，后者的结果更可信，波动更小。
统计检验的效能：样本量越大，统计检验发现真实差异或效应（如果存在）的能力越强，即功效越高，小样本可能漏掉实际存在的差异（第二类错误）。
成本与可行性：样本量越大，调查/实验所需的时间、人力和金钱成本也越高，需要在精度、效能和现实约束之间找到平衡点。

计算或决定样本量时,主要考虑以下四个因素，它们相互关联：

总体变异性：
- 是什么？ 总体中个体的差异程度，用标准差（σ）或比例（p）来度量。
- 如何影响？ 变异性越大，需要的样本量就越大，以“捕捉”到这种多样性，如果所有人都几乎一样，很小的样本就够了。
可接受的误差范围：
- 是什么？ 你允许样本估计值与总体真实值之间的最大差异，也称为“边际误差”。
- 如何影响？ 你要求的精度越高（可接受的误差范围越小），需要的样本量就越大，误差范围±5%比±10%需要更多的样本。
置信水平：
- 是什么？ 你希望估计结果有多大的把握，常用90%、95%、99%。
- 如何影响？ 置信水平越高（例如从95%提升到99%），意味着你需要更宽的“保险范围”，因此需要的样本量也越大。
效应大小：
- 是什么？ 你希望检测到的差异或关联的强度，在假设检验中非常重要。
- 如何影响？ 你想检测的效应越小，需要的样本量就越大（因为小信号更难从噪音中分辨出来）。

对于最常见的估计总体比例的情况，有一个简化公式可以体现上述关系：

n = (Z² p (1-p)) / E²

从这个公式可以看出：

注意：对于估计均值、进行假设检验（如T检验、方差分析）、多因素研究等更复杂的情况，有专门的计算公式或软件。

明确研究目标：是估计一个值（如平均满意度），还是比较两组差异（如A/B测试）？
确定关键参数：
- 设定你的置信水平（通常95%）。
- 设定你能接受的误差范围。
- 预估变异性（参考以往研究或进行预实验）。
- 如做检验,明确想检测的效应大小和期望的统计功效（通常80%）。
使用工具计算：
- 在线计算器：G*Power, 各种统计网站提供的简易计算器。
- 统计软件：R, Python (statsmodels), SPSS, SAS等都有样本量计算功能。
- 查阅文献：参考类似研究使用的样本量。
考虑现实调整：考虑无应答率、脱落率（如实验中有被试退出），将计算出的样本量适当扩大（例如除以0.8，假设80%的有效回收率）。