Carles Marin

mentions 1 type Person feed RSS

// recent coverage 1 mentions

03:54

2026-06-29

discuss.huggingface.co

large-language-models

A comprehensive, bilingual guide to Transformers: From foundations to KV-cache compression & attention dynamics

Carles Marin released an open-source bilingual guide on Transformer architectures, covering attention dynamics, KV-cache compression, and advanced concepts like grokking. The resource includes reprodu…

// co-occurs with top 2 entities

TAF Agent 1 Transformers 1