一、核心定义

星博讯 AI基础认知 2026-04-09 1

召回率衡量的是模型找出所有真实正例的能力,其核心问题是：

一、核心定义-第1张图片-星博讯网络科技知识-SEO优化技巧|AI知识科普|互联网行业干货大全

“在所有的真实正样本中，模型正确地找出了多少？”

它的计算公式为： 召回率 = TP / (TP + FN)

召回率越高，说明模型“漏掉”的正样本越少，捕捉能力越强。

直观理解与场景

类比（医疗筛查）： 假设一个城市有100名真正的感染者（正样本）。

典型应用场景（高召回率至关重要）：

在这些场景中，“False Negative（漏报）”的代价非常高,因此需要优先优化召回率。

这是理解召回率的关键，通常与召回率一同提及的是精确率。

两者的权衡（Trade-off）： 在绝大多数模型中，提高召回率往往会降低精确率,反之亦然。

如何提高召回率？ 让模型预测正例时“更敏感”、“更宽松”，这会导致一些实际为负的样本也被预测为正（FP增加），从而可能增加误报,降低精确率。
如何提高精确率？ 让模型预测正例时“更保守”、“更严格”，只有非常有把握的才预测为正，这会导致一些实际为正的样本被预测为负（FN增加），从而增加漏报,降低召回率。

调整分类阈值 对于输出概率的模型（如逻辑回归、神经网络），存在一个决策阈值（通常为0.5）。

解决类别不平衡问题 当负样本远多于正样本时，模型可能会倾向于将样本都预测为负来获得“整体高准确率”，但这会导致极低的召回率,解决方法：

改进模型本身

由于召回率和精确率需要权衡,常使用一个综合指标：

F1分数：召回率和精确率的调和平均数。
- F1 = 2 * (Precision * Recall) / (Precision + Recall)
- 只有当P和R都较高时，F1才会高,它寻求两者之间的一个平衡。
PR曲线：以召回率为横轴,精确率为纵轴绘制的曲线。
- 曲线越靠近右上角（Recall高，Precision也高）,模型性能越好。
- 曲线下的面积称为AP值,常用于比较模型。
- PR曲线在不平衡数据上比ROC曲线更敏感、更具参考价值。