Grok 4.1

mentions 1 type Person feed RSS

// recent coverage 1 mentions

21:48

2026-06-15

arxiv.org

large-language-models

DPBench: Structural Determinants of Multi-Agent LLM Coordination

Researchers introduced DPBench, a benchmark evaluating coordination in multi-agent LLM systems, finding that protocol structure—not model capability—determines deadlock rates. GPT-5.2 achieved 25% dea…

// co-occurs with top 5 entities

DPBench 1 GPT-5.2 1 Claude Opus 4.5 1 Gemini 2.5 Flash 1 Llama 4 Maverick 1