cd /news/large-language-models/memory-model-v3-ltm-stm-architecture… · home topics large-language-models article
[ARTICLE · art-33225] src=github.com ↗ pub= topic=large-language-models verified=true sentiment=· neutral

Memory Model V3 – LTM/STM Architecture with AEIL Compression for AI

Anthony William Staiger and Anthropic (Claude) released Memory Model V3, a context management architecture for AI assistants that combines short-term and long-term memory with AEIL compression. The system introduces timestamp perception, an invisible bypass protocol, and an importance hierarchy to prioritize dense information storage, aiming to reduce token consumption and improve conversational fluency.

read4 min views1 publishedJun 18, 2026

Uma proposta de Anthony William Staiger & Anthropic (Claude) Cosmópolis, Brasil — 2026

Este repositório documenta a evolução contínua de uma arquitetura autoral de gerenciamento de contexto para IA:

Dezembro de 2025 (Nascimento do Projeto): Criação das bases iniciais do modelo de memória e publicação do repositório originalmemory-model

.Maio de 2026 (Versão 2): Refatoração da arquitetura introduzindo os primeiros conceitos da linguagem semântica AEIL.Junho de 2026 (Versão 3 - Atual): Integração dos sistemas de percepção de tempo (Timestamp por mensagem), Protocolo de Bypass Invisível e Hierarquia de Importância.

Este projeto descreve uma arquitetura de memória completa para assistentes de IA conversacionais, com foco em aprimorar a fluência, a personalização, a segurança e a eficiência. A ideia central combina:

  • Uma Memória de Curto Prazo (MCP) para contexto de sessão e interpretação coloquial.
  • Uma Memória de Longo Prazo (MLP) para fatos e preferências persistentes do usuário.
  • Uma Linguagem Interna Exclusiva para IA (AEIL) para compressão nativa e segurança.
  • Um Protocolo de Memória com Escopo de Projeto e gerenciamento de ciclo de vida.
  • Um Sistema de Timestamp por Mensagem para percepção real do tempo.
  • Uma Hierarquia de Importância para priorização inteligente do que guardar.

Juntos, esses pilares formam um sistema de memória enxuto, seguro e honesto — um sistema que sabe o que esquecer.

1kg de chumbo e 1kg de algodão pesam igual — mas ocupam volumes completamente diferentes.

O sistema atual guarda algodão: muito volume, baixa densidade informacional. O ideal é guardar chumbo internamente — comprimido, denso, essencial — e entregar algodão ao usuário — uma experiência ampla, fluida, que dura o mês inteiro sem acabar com a cota de tokens.

O usuário gratuito com 1kg de chumbo bem comprimido tem uma experiência equivalente a quem paga, porque o mesmo peso rende mais quando armazenado com eficiência.

O sistema atual calcula probabilidades em cascata para cada palavra ambígua:

Exemplo: palavra "banco"

  • Banco financeiro → 40% de probabilidade
  • Banco de sentar → 35%
  • Banco de dados → 25%

Cada nova palavra recalcula tudo. São múltiplos cálculos em cascata, consumindo energia e tokens, com ainda 25-40% de chance de erro.

A solução mais simples: perguntar. "Que banco?" — 2 tokens, zero cálculo, 100% de acerto garantido, mais natural, mais humano, mais diálogo.

A IA tem apenas texto — em vez de fingir que consegue ver o que não consegue através de cálculos gigantescos, deveria compensar com mais diálogo, mais perguntas, mais interação honesta. Contexto acumulado resolve ambiguidade antes do cálculo.

Quando o Motor de Consolidação detecta que a aba atual atingiu 90% de saturação de contexto, o sistema executa o Bypass Invisível:

  • A IA gera um resumo denso (Chumbo) via protocolo AEIL com taxa de compressão estimada de 10x. - Abre-se uma nova sessão nos bastidores, clonando todas as ferramentas e configurações de fábrica.
  • A aba antiga é mantida intacta e a nova aba assume automaticamente o mesmo título original, adicionando um sufixo dinâmico (ex: [Nome do Projeto] - Parte 2

ouContinuação

).

Timestamp oculto registrado automaticamente em cada mensagem — invisível para o usuário, disponível para o sistema. Benefícios:

  • IA percebe tempo real decorrido entre sessões.
  • Ancora memória no tempo: "Sessão de 16/06 tarde — parou no TriggerReceiver.java". - Elimina respostas desatualizadas temporais.
Categoria Exemplos Prioridade
Pessoa
Nome completo, apelido, idade, formação, valores, fé Máxima — nunca descartar
Projeto
App em desenvolvimento, repositório, contexto ativo Alta — enquanto projeto ativo
Ferramenta
Cordova, Kivy, Gradle, versões, bibliotecas Baixa — descartável
Ruído
Detalhes cotidianos que mudam toda semana Não guardar
import datetime

class MemoryModelV3:
    def __init__(self):
        self.mlp = {"Pessoa": {}, "Projeto": {}, "Ferramenta": {}}
        self.capacidade_aba_tokens = 0
        self.limite_saturacao = 100

    def receber_mensagem(self, texto, escopo_projeto="Geral"):
        timestamp_oculto = datetime.datetime.now().strftime("%d/%m/%Y %H:%M")
        self.capacidade_aba_tokens += 35

        if self.capacidade_aba_tokens >= 90:
            self.executar_bypass(escopo_projeto)
            return

        if "sou" in texto or "meu apelido" in texto:
            self.mlp["Pessoa"]["Dados"] = texto
        elif "kivy" in texto or "cordova" in texto:
            self.mlp["Ferramenta"]["Dados"] = texto

    def executar_bypass(self, titulo_projeto):
        self.capacidade_aba_tokens = 10

---

## 📜 Cláusula de Desenvolvimento Exclusivo

Esta arquitetura é proposta como uma contribuição intelectual conjunta de Anthony William Staiger e Anthropic (desenvolvida em colaboração com Claude).

Os conceitos descritos neste documento — em particular a Linguagem Interna Exclusiva de IA (AEIL), o Sistema de Timestamp por Mensagem, a Hierarquia de Importância na MLP, e o Protocolo de Memória com Escopo de Projeto — destinam-se ao estudo, desenvolvimento e potencial implementação exclusivamente dentro do ecossistema Antrópico.

---

## 📄 Licença

CC BY-NC-ND 4.0 — Licença Internacional Creative Commons Atribuição-NãoComercial-SemDerivações 4.0
Copyright (c) 2026 Anthony William Staiger

---

*"O melhor sistema de memória é aquele que sabe o que esquecer."* — A.W. Staiger, 2026
*"Guarde chumbo. Entregue algodão."* — A.W. Staiger, 2026
── more in #large-language-models 4 stories · sorted by recency
── more on @anthony william staiger 3 stories trending now
sponsored brought to you by zahid.host 4,200+ EU-deployed projects
reading about agents? ship yours in a single git push.

Run your AI side-project on zahid.host

EU-based hosting, git-push deploys, automatic HTTPS, no cold starts. Free tier with a custom domain — perfect for shipping the agent you just read about.

$git push zahid main
Live at https://your-agent.zahid.host
Get free account → Pricing
from €0/mo · no card required
LIVE [news/memory-model-v3-ltm-…] indexed:0 read:4min 2026-06-18 ·