Ross Pomeroy

mentions 1 type Person feed RSS

// recent coverage 1 mentions

18:12

2026-06-27

letsdatascience.com

large-language-models

Critics Highlight AI Failures on Simple Tasks

A peer-reviewed PNAS Nexus study found that leading large language models, including GPT-4o, Claude 3.5 Sonnet, GPT-5, Claude Opus 4.1, and Gemini 2.5, fail catastrophically on simple cognitive tasks …

// co-occurs with top 7 entities

GPT-4o 1 Claude 3.5 Sonnet 1 GPT-5 1 Claude Opus 4.1 1 Gemini 2.5 1 CUNY 1 Marc Andreessen 1