线性回归与逻辑回归

发布于：2025-02-11 ⋅ 阅读:(103) ⋅ 点赞:(0)

线性回归是一种用于预测连续型目标变量（因变量）与一个或多个自变量（特征）之间关系的模型。其基本假设是因变量与自变量之间存在线性关系。

数学表达式为：
$\beta_0 + \beta_1 x_1 + \beta_2 x_2 + \cdots + \beta_n x_n$
其中：

线性回归常用的损失函数是均方误差（Mean Squared Error, MSE），定义为预测值与真实值之间差异的平方的平均值：

$\text{MSE} = \frac{1}{m} \sum_{i=1}^{m} (y_i - \hat{y}_i)^2$

其中：

最小化MSE可以找到最佳的回归系数，使模型对训练数据的预测误差最小。

逻辑回归是一种用于二分类或多分类任务的模型，旨在预测样本属于某一类别的概率。尽管名称中含有“回归”二字，但其主要用于分类问题。

数学表达式（用于二分类）为：
$\sigma(z) = \frac{1}{1 + e^{-z}}$
其中：

即对线性回归的输出多了一层取sigmoid。

逻辑回归常用的损失函数是对数损失函数（Log Loss），也称为交叉熵损失函数，定义为：

$\text{Log Loss} = -\frac{1}{m} \sum_{i=1}^{m} \left[ y_i \log(\hat{y}_i) + (1 - y_i) \log(1 - \hat{y}_i) \right]$

其中：

最小化对数损失函数可以找到最佳的回归系数，使模型对训练数据的分类概率误差最小。
训练完成之后，在预测时，当输出 $> 0.5$ 认为预测值是1，反之为0。