GeekNews AI Weekly Deep Dive - 2026-06-15

HBM costs have grown from 52% of AI chip component costs in Q1 2024 to 63% in Q4 2025, with total AI chip component spending rising from $22B to $52B. Reasonix is an open-source terminal coding agent optimized for DeepSeek API, using an append-only loop to maximize prefix cache hits. Microsoft is reportedly canceling most Claude Code licenses and moving engineers to GitHub Copilot CLI to reduce internal AI tool costs.

HBM은 Nvidia, AMD, Google, Amazon AI 칩의 생산량 가중 평균 기준으로 2024년 1분기 부품 비용의 52%에서 2025년 4분기 63%까지 커진 것으로 추정됩니다. Reasonix는 DeepSeek API에 직접 맞춘 오픈소스 터미널 코딩 에이전트로, append-only 루프를 통해 DeepSeek의 prefix cache를 최대한 유지하는 설계를 내세웁니다. 'Microsoft 보고서, AI가 인간 직원 고용보다 더 비싸다고 밝혀', '모든 카드에서 병렬 에이전트를 실행하는 오픈소스 Kanban 데스크톱 앱', '한컴, LG ‘챗엑사원’에 AI 에이전트 공급'도 함께 볼 만합니다. 핵심 내용 요약: HBM은 Nvidia, AMD, Google, Amazon AI 칩의 생산량 가중 평균 기준으로 2024년 1분기 부품 비용의 52%에서 2025년 4분기 63%까지 커진 것으로 추정됩니다. 같은 기간 전체 AI 칩 부품 지출은 약 220억 달러에서 520억 달러로 늘었고, HBM 지출만 약 200억 달러 증가분을 차지했습니다. 2026년에는 메모리 공급 부족과 가격 상승이 이어질 수 있어, AI 인프라 비용 압력의 핵심이 연산 로직보다 메모리 쪽으로 더 이동할 가능성이 큽니다. 핵심 내용 요약: Reasonix는 DeepSeek API에 직접 맞춘 오픈소스 터미널 코딩 에이전트로, append-only 루프를 통해 DeepSeek의 prefix cache를 최대한 유지하는 설계를 내세웁니다. 긴 세션에서 높은 캐시 히트율을 유지해 입력 토큰 비용을 낮추고, V4-Flash와 V4-Pro를 상황에 따라 전환하며 MCP, 샌드박스, 계획 모드, 이벤트 재생 기능을 제공합니다. 핵심 차별점은 IDE 플러그인보다 터미널 중심 워크플로와 평문 설정, 감사 가능한 실행 기록에 초점을 둔 점입니다. 핵심 내용 요약: Microsoft는 내부 AI 도구 비용을 줄이기 위해 대부분의 Claude Code 직접 라이선스를 취소하고 엔지니어들을 GitHub Copilot CLI로 옮기는 중이라고 전해졌습니다. Uber도 2026년 AI 코딩 도구 예산을 4개월 만에 소진한 사례로 언급되며, 기업이 생산성 향상을 위해 토큰 사용을 늘릴수록 단가 하락에도 총비용은 커질 수 있다는 점이 부각됩니다. 에이전트형 AI는 작업당 토큰 소비가 커서, 도입 확산이 곧 비용 절감으로 이어진다고 보기 어렵다는 메시지입니다. 핵심 내용 요약: KanBots는 칸반 카드마다 Claude Code나 Codex를 병렬로 실행하고, 진행 상황과 결정 요청, 비용을 보드에 실시간 표시하는 로컬 우선 데스크톱 앱입니다. 각 작업은 별도 git worktree와 브랜치에서 격리되며, Autopilot은 제품·엔지니어·리뷰어·테스터 같은 페르소나를 돌려 작업 분할과 검토를 수행합니다. 무료 MIT 라이선스 데스크톱 앱과 팀 동기화·알림·대시보드를 제공하는 유료 Cloud 제품으로 나뉘어 있습니다. 핵심 내용 요약: 한컴은 LG AI연구원과 전략적 사업 얼라이언스를 맺고 자체 AI 에이전트를 생성형 AI 플랫폼 챗엑사원에 공급하기로 했습니다. 한컴의 에이전트 기술과 LG AI연구원의 서비스 인프라를 결합해 공공과 민간 시장을 겨냥한 통합 솔루션을 개발하는 것이 핵심입니다. 이는 한컴 AI 에이전트가 외부 대화형 AI 플랫폼에 정식 탑재되는 사례로, 공공 AI 시장 공략의 출발점으로 해석됩니다. HBM은 Nvidia, AMD, Google, Amazon AI 칩의 생산량 가중 평균 기준으로 2024년 1분기 부품 비용의 52%에서 2025년 4분기 63%까지 커진 것으로 추정됩니다. 긴 세션에서 높은 캐시 히트율을 유지해 입력 토큰 비용을 낮추고, V4-Flash와 V4-Pro를 상황에 따라 전환하며 MCP, 샌드박스, 계획 모드, 이벤트 재생 기능을 제공합니다. Microsoft는 내부 AI 도구 비용을 줄이기 위해 대부분의 Claude Code 직접 라이선스를 취소하고 엔지니어들을 GitHub Copilot CLI로 옮기는 중이라고 전해졌습니다. 이 조건들을 체크리스트로 옮겨, 도입 전에는 준비 상태를 확인하고 도입 후에는 비용·품질·책임 변화를 추적하세요.