New Study Analyzes Positional Encodings in Transformers: Orthogonal Methods Outperform Traditional Approaches in AI Model Performance

Theoretical Analysis of Positional Encodings in Transformer Models: Impact on Expressiveness and Generalization

View PDF HTML (experimental) Abstract:Positional encodings are a core part of transformer-based models, enabling processing of sequential data without recurrence. This paper presents a theoretical framework to analyze how various positional encoding methods, including sinusoidal, learned, relative, and bias-based methods like Attention with Linear Biases (ALiBi), impact a transformer's expressiveness, generalization ability, and extrapolation to longer sequences. Expressiveness is defined via fu...