Optimization

: 가장 낮은 Loss를 가진 가중치를 찾는 과정

Stochastic Gradient Descent

SGD + Momentum

Nesterov Momentum

Untitled

Untitled

AdaGrad