1.核心定义

星博讯 AI基础认知 2026-04-09 1

迁移学习 是指将从一个任务（源领域）中学到的知识，应用于另一个相关但不同的任务（目标领域）中，以提升后者性能和学习效率的过程。

1.核心定义-第1张图片-星博讯网络科技知识-SEO优化技巧|AI知识科普|互联网行业干货大全

简单类比：就像一个学会了打羽毛球的人，再学习打网球会更快，因为他已经掌握了球拍类运动的通用技能，如手眼协调、步伐移动等。

核心思想与动机：为什么不从头训练？

迁移学习有效的核心假设是：不同任务之间共享着一些通用的、底层的基础特征。

一个在ImageNet（包含猫、狗、车等）上训练的图像识别模型，已经学会了识别边缘、纹理、形状、物体部件等通用视觉特征，这些特征对于识别新的物体（如医疗细胞）同样有价值。

根据源领域和目标领域的异同,主要有以下几种范式：

方法	描述	适用场景	例子
基于实例的迁移	复用源领域中有用的数据样本（可能加权）。	领域差异小，数据分布略有不同。	调整源数据权重，用于目标训练。
基于特征的迁移	最常用，复用源模型学习到的特征表示（如神经网络中间层的输出）。	领域相关，任务可能不同。	使用在ImageNet上预训练的CNN，提取特征后用于花卉分类。
基于模型的迁移	复用源模型的部分结构或参数。	任务高度相关，模型结构相似。	微调预训练语言模型（如BERT）做情感分析。
基于关系的迁移	迁移源领域数据点之间的关系或逻辑。	关系型任务，如社交网络推荐。	迁移用户-物品的交互模式。

这是目前应用最广泛的场景,主要指预训练+微调范式。

步骤：

预训练阶段：在一个大型、通用的源数据集（如ImageNet用于图像，Wikipedia用于文本）上，训练一个大型的、深度的神经网络模型（如ResNet, BERT, GPT），此时模型学到了非常丰富和通用的特征表示。
微调阶段：
- 特征提取器：冻结预训练模型的大部分层（尤其是底层），只将其作为固定的“特征提取器”，然后在其顶部训练一个新的、简单的分类器（如全连接层）来解决目标任务。
- 微调：解冻预训练模型的全部或部分层，并用目标领域的小规模数据，以较小的学习率对整个网络（或后半部分）进行继续训练，使其适应新任务。