Loading...
TODO
本文我们构造了带动量项SGD的统一框架并给出了其PyTorch实现。
本文介绍一个经典的基于动量的加速算法:Heavy-ball method。
本文我们解读PyTorch中的优化器源码,并且简单实现一个SGD。
本文我们简要分析SGD的收敛性能。
本文介绍SGD优化器的参数更新公式并进行简单的编程实践。
本文我们分析Vanilla Gradient Descent在各种条件下的收敛性能。
本文我们介绍优化算法理论分析的一些基础概念、定理与理论。