Search: noisy gradients — Dictionary of AI

Exploding Gradient Intermediate

Gradients grow too large, causing divergence; mitigated by clipping, normalization, careful init.

Foundations & Theory

Gradient Clipping Intermediate

Limiting gradient magnitude to prevent exploding gradients.

AI Economics & Strategy

Gradient Leakage Intermediate

Recovering training data from gradients.

AI Economics & Strategy

Adaptive Optimization Intermediate

Methods like Adam adjusting learning rates dynamically.

Foundations & Theory

State Estimation Advanced

Inferring the agent’s internal state from noisy sensor data.

Robotics & Embodied AI

Vanishing Gradient Intermediate

Gradients shrink through layers, slowing learning in early layers; mitigated by ReLU, residuals, normalization.

Foundations & Theory

Denoising Diffusion Probabilistic Model Advanced

Diffusion model trained to remove noise step by step.

Diffusion & Generative Models

Stochastic Approximation Intermediate

Optimization under uncertainty.

Foundations & Theory

Scalable Oversight Advanced

Using limited human feedback to guide large models.

AI Safety & Alignment

Kalman Filter Intermediate

Optimal estimator for linear dynamic systems.

Time Series

Momentum Intermediate

Uses an exponential moving average of gradients to speed convergence and reduce oscillation.

Optimization

Weight Initialization Intermediate

Methods to set starting weights to preserve signal/gradient scales across layers.

Foundations & Theory

Residual Connection Intermediate

Allows gradients to bypass layers, enabling very deep networks.

AI Economics & Strategy

Reinforcement Learning Intermediate

A learning paradigm where an agent interacts with an environment and learns to choose actions to maximize cumulative reward.

Reinforcement Learning

Loss Function Intermediate

A function measuring prediction error (and sometimes calibration), guiding gradient-based optimization.

Foundations & Theory

Adam Intermediate

Popular optimizer combining momentum and per-parameter adaptive step sizes via first/second moment estimates.

Optimization

Stochastic Gradient Descent Intermediate

A gradient method using random minibatches for efficient training on large datasets.

Foundations & Theory

Epoch Intermediate

One complete traversal of the training dataset during training.

Foundations & Theory

Normalization Intermediate

Techniques that stabilize and speed training by normalizing activations; LayerNorm is common in Transformers.

Foundations & Theory

Federated Learning Intermediate

Training across many devices/silos without centralizing raw data; aggregates updates, not data.

Foundations & Theory

Recurrent Neural Network Intermediate

Networks with recurrent connections for sequences; largely supplanted by Transformers for many tasks.

Neural Networks

Gradient Noise Intermediate

Variability introduced by minibatch sampling during SGD.

AI Economics & Strategy

LSTM Intermediate

An RNN variant using gates to mitigate vanishing gradients and capture longer context.

Foundations & Theory

Depth vs Width Intermediate

Tradeoffs between many layers vs many neurons per layer.

AI Economics & Strategy

Policy Gradient Intermediate

Optimizing policies directly via gradient ascent on expected reward.

AI Economics & Strategy

Mode Collapse Advanced

Generator produces limited variety of outputs.

Diffusion & Generative Models

Optical Flow Intermediate

Pixel motion estimation between frames.

Computer Vision

Jacobian Advanced

Matrix of first-order derivatives for vector-valued functions.

Mathematics

Controller Intermediate

Algorithm computing control actions.

Foundations & Theory

Results for "noisy gradients"

Welcome to AI Glossary

Search

Browse

3D WordGraph