Mitigating Position Bias in Transformers via Layer-Specific Positional Embedding Scaling

wpnews.pro

cd /news/large-language-models/mitigating-position-bias-in-transfor… · home › topics › large-language-models › article

[ARTICLE · art-42914] src=arxiv.org ↗ pub=2026-06-29T04:00Z topic=large-language-models verified=true sentiment=↑ positive

Mitigating Position Bias in Transformers via Layer-Specific Positional Embedding Scaling

Researchers introduced LPES, a layer-specific positional embedding scaling method that mitigates the 'lost-in-the-middle' problem in LLMs by assigning distinct scaling factors to each layer, achieving up to 11.2% accuracy gain on key-value retrieval without fine-tuning or latency increase.

read1 min views1 publishedJun 29, 2026

arXiv:2606.27705v1 Announce Type: new Abstract: Large Language Models (LLMs) still struggle with the ``lost-in-the-middle'' problem, where critical information located in the middle of long-context inputs is often underrepresented or lost. While existing methods attempt to address this by combining multi-scale rotary position embeddings (RoPE), they typically suffer from high latency or rely on suboptimal hand-crafted scaling strategies. To overcome these limitations, we introduce a layer-specific positional embedding scaling~(LPES) method that assigns distinct scaling factors to each layer. LPES achieves a more balanced attention distribution without fine-tuning model parameters or increasing inference delay. A specially designed genetic algorithm is employed to efficiently select the optimal scaling factors for each layer by incorporating B'{e}zier curves to significantly reduce the search space. Extensive experiments demonstrate that LPES effectively mitigates positional attention bias and delivers consistent improvements across multiple long-context benchmarks, yielding up to an $11.2$% accuracy gain on the key-value retrieval dataset.

source & further reading

arxiv.org — original article

~/api · this article 200

$curl api.wpnews.pro/v1/news/mitigating-position-bias…

Read original on arxiv.org → arxiv.org/abs/2606.27705

mentioned entities

LPES

RoPE

metadata

slugmitigating-position-bias-in-transformers-via-layer-specific-positional-embedding

topic#large-language-models

secondary3 topics

sentimentpositive

canonicalarxiv.org

navigation

← prevv0.5.6

── more in #large-language-models 4 stories · sorted by recency

arxiv.org · 29 Jun · #large-language-models

Large Language Model Teaches Visual Students: Cross-Modality Transfer of Fine-Grained Conceptual Knowledge

arxiv.org · 29 Jun · #large-language-models

Position: The Term "Machine Unlearning" Is Overused in LLMs

arxiv.org · 29 Jun · #large-language-models

EntMTP: Accelerating LLM Inference with Entropy Guided Multi Token Prediction

arxiv.org · 29 Jun · #large-language-models

Ko-WideSearch: A Korean Breadth-Search Benchmark for Exhaustive Set Enumeration by Web Agents

── more on @lpes 3 stories trending now

wpnews · 28 May · #ai-startups

[AINews] Cognition raises $1B in $26B Series D

wpnews · 5 Jun · #ai-agents

Miasma Worm Targets AI Coding Agents via GitHub Repos

wpnews · 28 Jun · #ai-agents

OpenCode v1.17: Session Snapshots Undo Your AI Agent

sponsored brought to you by zahid.host 4,200+ EU-deployed projects

reading about agents? ship yours in a single git push.

Run your AI side-project on zahid.host

EU-based hosting, git-push deploys, automatic HTTPS, no cold starts. Free tier with a custom domain — perfect for shipping the agent you just read about.

$git push zahid main

→ Live at https://your-agent.zahid.host ✓

Get free account → Pricing

from €0/mo · no card required