AIStupidLevel

mentions 1 type Organization feed RSS

// recent coverage 1 mentions

03:54

2026-06-18

dev.to

large-language-models

Is AI Getting Quietly Dumber? A 24/7 Benchmark That Catches LLM Degradation

A new open-source benchmark platform called AIStupidLevel continuously monitors 21 production AI models from 7 providers for performance degradation. The platform runs 24/7 tests including coding, dee…

// co-occurs with top 7 entities

OpenAI 1 Anthropic 1 Google 1 xAI 1 DeepSeek 1 Kimi 1 GLM 1