定义与模型
- 试验场景:进行 (n) 次独立重复试验。
- 每次试验:只有两种结果——“成功”(概率 (p))或“失败”(概率 (1-p))。
- 随机变量 (X):表示 (n) 次试验中成功的次数,记为 (X \sim B(n, p))。
概率质量函数
[ P(X = k) = \binom{n}{k} p^k (1-p)^{n-k}, \quad k = 0, 1, 2, \dots, n ] (\binom{n}{k}) 是组合数,计算方式为 (\frac{n!}{k!(n-k)!})。

数字特征
- 期望(均值):(E(X) = np)
- 方差:(Var(X) = np(1-p))
- 标准差:(\sigma = \sqrt{np(1-p)})
- 矩母函数:(M(t) = (1-p + pe^t)^n)
性质
- 可加性:若 (X \sim B(n, p)),(Y \sim B(m, p)) 且相互独立,则 (X + Y \sim B(n+m, p))。
- 与伯努利分布的关系:当 (n=1) 时,二项分布退化为伯努利分布。
- 对称性:当 (p = 0.5) 时,分布对称;否则偏斜。
应用领域
- 质量控制:抽样检测中不合格品数量的建模。
- 医学统计:临床试验中有效病例数的分析。
- 金融风险:投资组合中违约事件次数的估计。
- 调查统计:具有特定特征的受访者人数预测。
近似与关联
- 泊松近似:当 (n) 很大、(p) 很小,且 (np) 适中时,可用泊松分布 (Pois(\lambda = np)) 近似。
- 正态近似:当 (n) 较大,(p) 不接近 0 或 1 时,可用正态分布 (N(np, np(1-p))) 近似(需连续性校正)。
重要前提
使用二项分布必须满足:
- 试验次数 (n) 固定。
- 每次试验独立。
- 成功概率 (p) 恒定。
实际应用中需谨慎验证条件,例如抽样时若不放回,则需用超几何分布修正。
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。