AI Blog

by Michele Laurelli

Back to Glossary

Weight Initialization

/weɪt ɪˌnɪʃəlaɪˈzeɪʃən/

Technique

Definition

Methods for setting initial values of neural network weights before training begins.

Proper initialization is crucial for effective training. Random initialization breaks symmetry. Methods like Xavier/Glorot (for tanh/sigmoid) and He initialization (for ReLU) ensure gradients flow well initially.

Examples

Xavier initialization for tanh layers

He initialization for ReLU layers

Zero initialization for biases

Related Terms

Vanishing Gradient

A problem in deep networks where gradients become extremely small, preventing effective learning in early layers.

Neural Network

A computational model inspired by biological neural networks, consisting of interconnected nodes (neurons) that process information.

Michele Laurelli - AI Research & Engineering