AI基础认知 最新 一、核心评测维度 能力与性能核心任务指标:根据任务类型选择,分类任务:准确率、精确率、召回率、F1分数、AUC-ROC,生成任务:BLEU、ROUGE、METEOR(用于翻译/、困惑度、人工评估(流畅度、相关性、创造性... 星博讯 2026-04-09 1 #Evaluation Criteria #Core Dimensions