{"entity": "AMD MI300X", "url": "https://wpnews.pro/entity/AMD MI300X", "count": 1, "articles": [{"slug": "real-time-llm-inference-on-standard-gpus-3k-tokens-s-per-request", "title": "Real-time LLM Inference on Standard GPUs: 3k tokens/s per request", "url": "https://wpnews.pro/news/real-time-llm-inference-on-standard-gpus-3k-tokens-s-per-request", "published_at": "2026-05-29 09:47:23+00:00"}]}