Laneformer

mentions 1 type Organization feed RSS

// recent coverage 1 mentions

04:59

2026-06-17

dev.to

large-language-models

Kog hits 3K t/s on MI300X, no kernel switches — test it now

Kog AI achieved over 3,000 output tokens per second per request for an FP16 2B model on a single 8× MI300X node using a monokernel that eliminates per-token kernel launches. The technique collapses th…

// co-occurs with top 7 entities

Kog AI 1 AMD 1 MI300X 1 ROCm 1 HumanEval 1 HSA API 1 Kog Inference Engine 1

// topics top 5 topics

large language models 1 ai infrastructure 1 ai research 1 ai tools 1 developer tools 1