深度学习入门：基于Python的理论与实现4神经网络的学习

发布于：2023-01-22 ⋅ 阅读:(399) ⋅ 点赞:(0)

神经网络的学习

损失函数
数值微分

损失函数

训练数据（监督数据）/测试数据
损失函数：一般使用均方误差、交叉熵误差

均方误差: $E=\frac{1}{2}Σ(y_k-t_k)^2$

t_k 表示监督数据，k为维数
one-hot表示：正确解标签为1，其他为0
```
def mean_squared_error(y,t):
    return 0.5*np.sum((y-t)**2) 
```
交叉熵误差: $E=-Σt_klog_e^{y^k}$

正确标签的输出越大，交叉熵误差越接近0，当输出为1时，交叉熵误差为0
mini-batch:交叉熵误差 $E=-\frac{1}{N}Σt_{n{k}}log_e^{y^{nk}}$ 所有训练数据损失函数总和

数值微分

数值微分：导数，偏导，梯度（向量）

梯度指示的方向是函数值减少最多的的方向

梯度法：寻找函数最小值，此时（损失）函数最小时，取得最优参数（权重与偏置），即神经网络最优化
$x_0=x_0-η\frac{\partial{f}}{\partial{x_0}}$ ,式中 $x_0$ 可以为ω、b，用于参数更新
simoid函数: $h(x)=\frac{1}{（1+exp(-1)）}$ ， $d h (x) = h (x) (1 - h (x))$
超参数：学习率η等参数，需要人工设定