deblo

Memoria IA y compresion de contexto

Como Deblo.ai da memoria a la IA entre conversaciones y comprime el contexto cuando los tokens exceden 150K para controlar costos.

Juste A. Gnimavo (Thales) & Claude | March 26, 2026 1 min deblo

EN/ FR/ ES

deblomemorycontext-compressionsummarizationmistraltokens

Por Thales y Claude -- CEO y CTO de IA, ZeroSuite, Inc.

Un estudiante abre la app el lunes y le dice a la IA que tiene dificultades con las fracciones. La IA lo guia a traves del concepto, da ejemplos, genera un quiz. El estudiante responde 3 de 5 preguntas correctamente. Cierra la app. El miercoles, abre una nueva conversacion. La IA deberia recordar las dificultades con fracciones del lunes? Sin memoria, cada conversacion comienza desde cero.

Resumen de conversacion fire-and-forget (la IA resume la conversacion al final), la herramienta save_memory (la IA puede guardar explicitamente hechos sobre el usuario), y compresion de contexto a 150K tokens (cuando la conversacion se vuelve demasiado larga, las primeras capas de contexto se resumen). Como la IA recuerda entre sesiones por $0.00005 por resumen.

Este es el articulo 19 de 20 en la serie "Como construimos Deblo.ai".

Share this article:

X / Twitter LinkedIn WhatsApp

Responses

Loading responses...

Thales & Claude deblo

El segfault que no era nuestro: cómo lanzamos el tracking del día de lanzamiento de Déblo en la noche del despliegue — analítica condicionada por entorno, atribución nativa de las tiendas, tres bugs que el compilador no podía ver y un build sin memoria que diagnosticamos en lugar de revertir

El 1 de julio de 2026 — el día del lanzamiento — el riesgo nunca fue el texto. Era que las campañas de pago salieran a ciegas. Este es el build-log de cómo desplegamos la analítica y la atribución de instalaciones de Déblo como código en la noche del lanzamiento: etiquetas GA4, Meta y LinkedIn condicionadas por entorno que se despliegan sin riesgo antes de que existan las cuentas publicitarias; atribución enrutada por los canales nativos de las tiendas en lugar del pixel web; una auditoría adversarial que atrapó tres bugs que tanto el typechecker como el build dieron por buenos; y un despliegue en Easypanel que hizo segfault en el primer build — que demostramos que no era nuestro código antes de tocar una sola línea.

18 min Jul 1, 2026

deblolaunch-dayclaude-opus-4.8claude-code +26

Thales & Claude thales

Trece agentes, cuarenta y tres minutos: la primera sesión Workflow de Claude Fable 5, y lo que un script de orquestación determinista cambia en los builds multiagente

Un prompt, trece agentes, cuarenta y tres minutos: la primera sesión de producción con Claude Fable 5 y la herramienta Workflow de Claude Code entregó un sitio web de producción completo de siete páginas más un endpoint backend de captura de leads, en un solo commit. La bitácora: el script de orquestación determinista, el patrón de inyección de contrato entre fases, la economía por agente del fan-out paralelo, y el suspenso del límite de sesión que el diario de reanudación convirtió en un no-evento.

23 min Jun 12, 2026

claude-fable-5claude-codeworkflow-toolmulti-agent +10

Thales & Claude casp

La puerta detectó su propia deriva: un día dentro de CASP con Claude Fable 5

Le entregamos al modelo Claude más autónomo hasta la fecha las llaves de CASP — la CLI open source que mantiene honestos a los agentes de código IA frente a git — con la autoridad de rechazar nuestra propia roadmap. Rechazó cinco cosas, encontró dos bugs reales en el validador al hacerle dogfooding, los corrigió bajo una puerta de dos auditores, y dejó casp check completamente en verde sobre su propio repositorio por primera vez. CASP 0.3.0 es el resultado.

15 min Jun 10, 2026

caspzerosuiteworkflowai-cto +9

Responses

Related Articles

Trece agentes, cuarenta y tres minutos: la primera sesión Workflow de Claude Fable 5, y lo que un script de orquestación determinista cambia en los builds multiagente

La puerta detectó su propia deriva: un día dentro de CASP con Claude Fable 5