Memory Model V3 – LTM/STM Architecture with AEIL Compression for AI

Anthony William Staiger and Anthropic (Claude) released Memory Model V3, a context management architecture for AI assistants that combines short-term and long-term memory with AEIL compression. The system introduces timestamp perception, an invisible bypass protocol, and an importance hierarchy to prioritize dense information storage, aiming to reduce token consumption and improve conversational fluency.

Uma proposta de Anthony William Staiger & Anthropic Claude Cosmópolis, Brasil — 2026 Este repositório documenta a evolução contínua de uma arquitetura autoral de gerenciamento de contexto para IA: Dezembro de 2025 Nascimento do Projeto : Criação das bases iniciais do modelo de memória e publicação do repositório original memory-model . Maio de 2026 Versão 2 : Refatoração da arquitetura introduzindo os primeiros conceitos da linguagem semântica AEIL. Junho de 2026 Versão 3 - Atual : Integração dos sistemas de percepção de tempo Timestamp por mensagem , Protocolo de Bypass Invisível e Hierarquia de Importância. Este projeto descreve uma arquitetura de memória completa para assistentes de IA conversacionais, com foco em aprimorar a fluência, a personalização, a segurança e a eficiência. A ideia central combina: - Uma Memória de Curto Prazo MCP para contexto de sessão e interpretação coloquial. - Uma Memória de Longo Prazo MLP para fatos e preferências persistentes do usuário. - Uma Linguagem Interna Exclusiva para IA AEIL para compressão nativa e segurança. - Um Protocolo de Memória com Escopo de Projeto e gerenciamento de ciclo de vida. - Um Sistema de Timestamp por Mensagem para percepção real do tempo. - Uma Hierarquia de Importância para priorização inteligente do que guardar. Juntos, esses pilares formam um sistema de memória enxuto, seguro e honesto — um sistema que sabe o que esquecer. 1kg de chumbo e 1kg de algodão pesam igual — mas ocupam volumes completamente diferentes. O sistema atual guarda algodão : muito volume, baixa densidade informacional. O ideal é guardar chumbo internamente — comprimido, denso, essencial — e entregar algodão ao usuário — uma experiência ampla, fluida, que dura o mês inteiro sem acabar com a cota de tokens. O usuário gratuito com 1kg de chumbo bem comprimido tem uma experiência equivalente a quem paga, porque o mesmo peso rende mais quando armazenado com eficiência. O sistema atual calcula probabilidades em cascata para cada palavra ambígua: Exemplo: palavra "banco" - Banco financeiro → 40% de probabilidade - Banco de sentar → 35% - Banco de dados → 25% Cada nova palavra recalcula tudo. São múltiplos cálculos em cascata, consumindo energia e tokens, com ainda 25-40% de chance de erro. A solução mais simples: perguntar. "Que banco?" — 2 tokens, zero cálculo, 100% de acerto garantido, mais natural, mais humano, mais diálogo. A IA tem apenas texto — em vez de fingir que consegue ver o que não consegue através de cálculos gigantescos, deveria compensar com mais diálogo, mais perguntas, mais interação honesta. Contexto acumulado resolve ambiguidade antes do cálculo. Quando o Motor de Consolidação detecta que a aba atual atingiu 90% de saturação de contexto, o sistema executa o Bypass Invisível : - A IA gera um resumo denso Chumbo via protocolo AEIL com taxa de compressão estimada de 10x . - Abre-se uma nova sessão nos bastidores, clonando todas as ferramentas e configurações de fábrica. - A aba antiga é mantida intacta e a nova aba assume automaticamente o mesmo título original, adicionando um sufixo dinâmico ex: Nome do Projeto - Parte 2 ou Continuação . Timestamp oculto registrado automaticamente em cada mensagem — invisível para o usuário, disponível para o sistema. Benefícios: - IA percebe tempo real decorrido entre sessões. - Ancora memória no tempo: "Sessão de 16/06 tarde — parou no TriggerReceiver.java" . - Elimina respostas desatualizadas temporais. | Categoria | Exemplos | Prioridade | |---|---|---| Pessoa | Nome completo, apelido, idade, formação, valores, fé | Máxima — nunca descartar | Projeto | App em desenvolvimento, repositório, contexto ativo | Alta — enquanto projeto ativo | Ferramenta | Cordova, Kivy, Gradle, versões, bibliotecas | Baixa — descartável | Ruído | Detalhes cotidianos que mudam toda semana | Não guardar | python import datetime class MemoryModelV3: def init self : self.mlp = {"Pessoa": {}, "Projeto": {}, "Ferramenta": {}} self.capacidade aba tokens = 0 self.limite saturacao = 100 def receber mensagem self, texto, escopo projeto="Geral" : timestamp oculto = datetime.datetime.now .strftime "%d/%m/%Y %H:%M" self.capacidade aba tokens += 35 if self.capacidade aba tokens = 90: self.executar bypass escopo projeto return if "sou" in texto or "meu apelido" in texto: self.mlp "Pessoa" "Dados" = texto elif "kivy" in texto or "cordova" in texto: self.mlp "Ferramenta" "Dados" = texto def executar bypass self, titulo projeto : self.capacidade aba tokens = 10 --- 📜 Cláusula de Desenvolvimento Exclusivo Esta arquitetura é proposta como uma contribuição intelectual conjunta de Anthony William Staiger e Anthropic desenvolvida em colaboração com Claude . Os conceitos descritos neste documento — em particular a Linguagem Interna Exclusiva de IA AEIL , o Sistema de Timestamp por Mensagem, a Hierarquia de Importância na MLP, e o Protocolo de Memória com Escopo de Projeto — destinam-se ao estudo, desenvolvimento e potencial implementação exclusivamente dentro do ecossistema Antrópico. --- 📄 Licença CC BY-NC-ND 4.0 — Licença Internacional Creative Commons Atribuição-NãoComercial-SemDerivações 4.0 Copyright c 2026 Anthony William Staiger --- "O melhor sistema de memória é aquele que sabe o que esquecer." — A.W. Staiger, 2026 "Guarde chumbo. Entregue algodão." — A.W. Staiger, 2026