李宏毅《机器学习》学习笔记5.2

2021/7/22 6:09:41

编程Tag： 模型输出学习 mu 标准化 sigma 5.2 loss 李宏毅

本文主要是介绍李宏毅《机器学习》学习笔记5.2，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

4.classification

分类模型的输出

若是将不同分类编号作为真值，可能让模型误认为相邻的分类是相近的，因此使用向量表示不同类别。

模型最后的输出值需要softmax处理，使得输出值落在0-1区间。softmax和标准化类似。

分类模型loss function

分类模型的loss通过cross-entropy计算，因为传统的均方根方法在loss大值区斜率过于平坦，训练时容易卡住。

5.feature normalization

让不同维度的特征标准化，更利于loss的收敛。

各layer的输出也要进行标准化，与输入时各个feature在各自维度上标准化不同，layer的输出需要一起标准化。

这种将所有input共同标准化的方法，使得除了本身的网络，还有另一个“巨大的网络”来计算\(\mu\)和\(\sigma\)。另外为了避免各输出平均值为0带来的限制，在训练后期可以引入参数\(\beta\)和\(\gamma\)。

在实际testing过程中，我们可能等不到样本够一个batch就运行，那该如何计算\(\mu\)和\(\sigma\)呢？在训练过程中，我们可以使用先前计算好的\(\mu\)和\(\sigma\)的平均值。