AI Blog

by Michele Laurelli

RMSprop

Algorithm

Definition

Adaptive learning rate optimization algorithm using moving average of squared gradients.

Divides learning rate by exponential moving average of squared gradients. Addresses Adagrad's diminishing learning rates. Good for RNNs and non-stationary problems.

Examples

RNN training

Non-convex optimization

Adaptive learning

Related Terms

Gradient Descent

An optimization algorithm that iteratively adjusts parameters to minimize a loss function by following the gradient.

Michele Laurelli - AI Research & Engineering