scikit-learn/sklearn学习|弹性网络ElasticNet解读-EW帮帮网

【1】引言

前序学习进程中，对用scikit-learn表达线性回归、岭回归、套索回归和多任务套索回归进行了初步解读。
线性回归的目的，是将因变量 $y$ 表达成由自变量 $x$ 、线性系数矩阵 $w$ 和截距 $b$ 组成线性函数式。
线性回归获得函数式：
$y=\sum_{i=1}^{n}w_{i}\cdot x_{i}+b=w^T{x}+b$
对应的均方误差函数计算式为：
$L(w,b)=\sum_{i=1}^{n}(y_{i}-\hat{y_{i}})^2=\sum_{i=1}^{n}(y_{i}-(w^Tx_{i}+b))^2$ 在这里， $y$ 是第i个样本的真实值， $\hat{y}$ 是第i个样本的预测值。
普通线性回归的均方误差将真实值和预测值作差后求平方和即可。

【2】均方误差函数

实际上很多时候数据之间不一定是理想化的线性关系，所以需要对线性关系式进行修正，修正项位于均方误差计算函数中，这个时候就衍生出其他回归方法，至少包括岭回归、套索回归等，各种回归方法的区别就在于均方误差函数的修正项定义方式不一样。

【2.1】Ridge岭回归

Ridge岭回归增加了L2正则化惩罚项：
$L(w,b)=\sum_{i=1}^{n}(y_{i}-\hat{y_{i}})^2+\alpha\sum_{j=1}^{m}w_{j}^{2}=\sum_{i=1}^{n}(y_{i}-(w^Tx_{i}+b))^2+\alpha\sum_{i=1}^{m}w_{i}^{2}$ 在这里， $y$ 是第i个样本的真实值， $\hat{y}$ 是第i个样本的预测值。
新增加的L2正则化惩罚项为 $\alpha\sum_{i=1}^{m}w_{i}^{2}，其中\alpha\geq0$

【2.2】Lasso套索回归

Lasso套索回归的均方误差公式为：
$L(w,b)=\frac{1}{2n}\sum_{i=1}^{n}(y_{i}-\hat{y_{i}})^2+\alpha\sum_{j=1}^{n}\left | w_{j} \right |=\frac{1}{2n}\sum_{i=1}^{n}(y_{i}-(w^Tx_{i}+b))^2+\alpha\sum_{i=1}^{n}\left | w_{i} \right |$
新增加的 $L 1$ 正则化惩罚项为 $\alpha\sum_{i=1}^{m}\left | w_{i} \right |,\alpha \geq0$

【2.3】MultiTaskLasso多任务套索回归

MultiTaskLasso多任务套索回归的均方误差公式为：
$L(w,b)=\frac{1}{2n}\sum_{i=1}^{n}(y_{i}-\hat{y_{i}})^2+\alpha\sum_{i=1}^{n} \sqrt{\sum_{j=1}^{m}w_{i,j}^2}=\\\sum_{i=1}^{n}(y_{i}-(w^Tx_{i}+b))^2+\alpha\sum_{i=1}^{n}\sqrt{\sum_{j=1}^{m}w_{i,j}^2}$
同时使用了 $L 1, L 2$ 正则化惩罚项
$\alpha\sum_{i=1}^{n}\sqrt{\sum_{j=1}^{m}w_{i,j}^2},\alpha \geq0$

【3】ElasticNet弹性网络

ElasticNet弹性网络的均方误差函数计算式MultiTaskLasso多任务套索回归类似，通过混合 $L 1, L 2$ 正则化范数来修正均方误差：

$L(w,b)=\frac{1}{2n}\sum_{i=1}^{n}(y_{i}-\hat{y_{i}})^2+\alpha(\rho \sum_{i=1}^{n}|w_{i}|+\frac{1-\rho}{2}\sum_{i=1}^{n}w_{i}^2)=\sum_{i=1}^{n}(y_{i}-(w^Tx_{i}+b))^2+\alpha(\rho \sum_{i=1}^{n}|w_{i}|+\frac{1-\rho}{2}\sum_{i=1}^{n}w_{i}^2)$

新增加的 $L 1 L 2$ 惩罚项包括三部分：
第一部分 $\alpha$ 为惩罚项的强度，满足 $\alpha\geq0$
第二项 $\rho \sum_{i=1}^{n}|w_{i}|$ 是 $L 1$ 正则化项，它的存在会产生稀疏解，可以使部分系数为0；
第三项 $\frac{1-\rho}{2}\sum_{i=1}^{n}w_{i}^2$ 是 $L 2$ 正则化项，它的存在可以限制系数的绝对值不过大，实现防止过拟合。
其中 $\rho\in[0,1]$ ，当 $\rho=1$ 时弹性网络回到套索回归Lasso，当 $\rho=0$ 时弹性网络回到岭回归Ridge。

【4】总结

初步学习了弹性网络ElasticNet的基本概念。

scikit-learn/sklearn学习|弹性网络ElasticNet解读

【1】引言

【2】均方误差函数

【2.1】Ridge岭回归

【2.2】Lasso套索回归

【2.3】MultiTaskLasso多任务套索回归

【3】ElasticNet弹性网络

【4】总结

网站公告

今日签到

热门文章

最新发布