机器学习——期末复习(上)

SVM支持向量机

作业

1

关于核化软间隔支持向量机,推导目标函数的原始问题转换为对偶问题的过程、KKT条件、预测函数。

原始问题

软间隔SVM的目标函数为:

约束条件:

其中 $C>0$ 是惩罚参数,$\xi_i$ 是松弛变量,$\phi(\cdot)$ 是特征映射。

转化为对偶问题

  1. 构造拉格朗日函数

    其中 $\alpha_i \geq 0, \beta_i \geq 0$ 是拉格朗日乘子。

  2. 对原始变量求偏导并令其为零

  • 对 $\mathbf{w}$ 求导:
  • 对 $b$ 求导:
  • 对 $\xi_i$ 求导:
  1. 代入拉格朗日函数消去原始变量
    将 $\mathbf{w}$ 和 $\beta_i$ 代入 $\mathcal{L}$,得到对偶目标函数:

    约束条件:

  2. 引入核函数
    用核函数 $K(\mathbf{x}_i, \mathbf{x}_j) = \phi(\mathbf{x}_i)^T \phi(\mathbf{x}_j)$ 替换内积,得到最终对偶问题:

    约束条件不变。

KKT条件

  • 原始可行性:$y_i (\mathbf{w}^T \phi(\mathbf{x}_i) + b) \geq 1 - \xi_i, \quad \xi_i \geq 0$
  • 对偶可行性:$\alpha_i \geq 0, \quad \beta_i = C - \alpha_i \geq 0$
  • 互补松弛性:$\alpha_i [y_i (\mathbf{w}^T \phi(\mathbf{x}_i) + b) - 1 + \xi_i] = 0, \quad \beta_i \xi_i = 0$
  • 梯度为零条件:已通过偏导数消去原始变量。

预测函数

测试样本 $\mathbf{x}$ 的预测函数为:

其中 $b$ 可通过任一支持向量(满足 $0 < \alpha_i < C$)计算:

2