核函数是机器学习，尤其是支持向量机（SVM）中一个非常核心且强大的工具。它的核心思想是低维不可分，映射到高维就可能变得可分

星博讯 AI基础认知 2026-04-09 36

核心思想 与动机

问题起源：在分类或回归任务中，我们经常遇到数据在原始特征空间（低维空间）中线性不可分的情况，用一条直线无论如何也无法完美分开一个圆圈内的点和圆圈外的点。
直觉思路：一个直观的想法是，如果我们能把数据点从原始空间（如二维平面）映射到一个更高维、甚至无限维的特征空间，那么在这个新空间里，数据点就有可能被一个超平面（即线性决策边界）分开。
- 类比：想象你在一个平地上（二维）看一群人，他们混杂在一起，无法用一条线分开，但如果你坐上热气球（上升到三维空间），从上往下看，可能就会发现他们其实站成了两个清晰的阵营。
关键挑战：直接进行高维映射会带来巨大的计算成本（“维度灾难”），计算高维空间中的内积或距离非常耗时，甚至对于无限维空间根本不可行。

核函数就是为了解决上述挑战而生的“数学魔法”。

定义：核函数 ( K(x, z) ) 是一个函数，它接受原始低维空间中的两个向量 ( x ) 和 ( z ) 作为输入，并直接计算出它们在某个高维特征空间 ( \phi(x) ) 和 ( \phi(z) ) 中的内积，而无需显式地知道映射函数 ( \phi ) 的具体形式。

[ K(x, z) = \langle \phi(x), \phi(z) \rangle ]

( \phi ) 是将数据从原始空间映射到高维特征空间的函数。

核技巧：核函数的精髓在于，我们永远不需要显式计算 ( \phi(x) ) 和 ( \phi(z) ) 这两个高维向量，而是直接通过一个在低维空间上的简单函数 ( K ) 得到它们在高维空间的内积结果，这完美地规避了高维计算的复杂性。

你可以把核函数理解为一种 “相似度比较器”。

线性核： [ K(x, z) = x^T z ]

这其实就是没有进行任何映射,直接在原始空间做内积，适用于本身已近似线性可分的数据。
多项式核： [ K(x, z) = (\gamma x^T z + r)^d ]
- 参数 ( d ) 是多项式的次数，它将数据映射到特征组合的空间（如 ( x_1^2, x_2^2, x_1x_2 ) 等）。
- 适合处理特征之间具有交互关系的非线性问题。
径向基函数核 / 高斯核： [ K(x, z) = \exp(-\gamma ||x - z||^2) ]
- 这是最常用、最强大的核函数之一。( \gamma ) 控制函数的宽度。
- 其物理意义是：两个点的相似度随着它们之间欧氏距离的增大而指数级衰减。
- 它实际上将数据映射到了无限维的特征空间，具有很强的非线性拟合能力。( \gamma ) 过大容易过拟合，过小则模型过于平滑。
Sigmoid核： [ K(x, z) = \tanh(\gamma x^T z + r) ]

形式上类似于神经网络的激活函数,但在某些条件下才满足Mercer定理（即才能作为有效的核函数），现在已较少使用。

主要应用：
- 核化支持向量机：这是核函数最经典的应用，将线性SVM转化为强大的非线性分类器。
- 核主成分分析：用于非线性降维。
- 高斯过程：核函数定义了高斯过程的协方差函数。
本质扩展：任何仅依赖于数据点之间内积的算法（如感知机、PCA、线性回归等），都可以通过“核技巧”进行“核化”，从而获得处理非线性问题的能力，这类方法统称为核方法。