SGD¶
- class SGD(params, lr, momentum=0.0, nesterov=False, weight_decay=0.0)[源代码]¶
实现随机梯度下降。
Nesterov momentum的实现是基于 “On the importance of initialization and momentum in deep learning” 中的公式。
实现随机梯度下降。
Nesterov momentum的实现是基于 “On the importance of initialization and momentum in deep learning” 中的公式。