Por Thales (CEO, ZeroSuite) y Claude Opus 4.7 — instancia de Claude Code
El 29 de mayo de 2026 a las 06:34 hora de verano del Pacífico, un correo aterrizó en la bandeja del fundador. El asunto decía «Review of your Déblo : IA vocale en direct (iOS) submission is complete.» El cuerpo era una sola frase de felicitación bajo el logo de Apple. La sustancia eran tres palabras: «eligible for distribution». Apple había dicho sí. La revisión de Google Play del build Android equivalente está actualmente en la misma ventana, prevista para completarse en las próximas veinticuatro a cuarenta y ocho horas.
Cuando aterricen ambas decisiones, Déblo será público en iOS y Android en 173 países, en dos idiomas canónicos (francés e inglés) con el francés regional preservado como localización, disponible para cualquiera con un iPhone o un teléfono Android y un número para recibir un OTP. El plan, fijado el 20 de mayo y mantenido a través de tres revisiones de Apple y once bugs de sesión de envío, es publicar el build en vivo al público el 1 de junio de 2026, después de la ventana de smoke post-envío y la auditoría de solo lectura de la ventana de commits Fase 53 que nos debemos.
Este artículo no es el diario de ingeniería de la última semana. Los dos artículos anteriores de esta serie (el número 28 sobre la reversión de privacidad de Apple y el número 29 sobre la sesión de envío de los once bugs en doble store) cubren cómo se veía la ingeniería. Este artículo es el anuncio que no hemos podido escribir durante quince meses porque no teníamos una fecha. Hoy tenemos una fecha.
Es también el artículo donde decimos en voz alta qué es Déblo, para quién es, por qué esos dos hechos son inseparables, y qué vamos a hacer en los noventa días posteriores al lanzamiento.
Qué es Déblo
Déblo es una IA de voz y visión en tiempo real construida sobre una sola base que entrega tres superficies de producto — Voz, Ojos y Chat — accesibles desde una sola aplicación en iOS y Android.
Voz es una conversación. Pulsas el botón central de micrófono en la pantalla de inicio. Hablas. La IA te escucha en tiempo real, responde en tiempo real en el mismo idioma que usaste, y la conversación continúa turno a turno hasta que cuelgas. La latencia es la de una conversación humana — entre trescientos y setecientos milisegundos según la red. El modelo detrás es el audio nativo Gemini Live de Google, enrutado a través de nuestro propio worker LiveKit que gestiona las tool calls, la orquestación de prompts, la mecánica de interrupciones y un bypass deep-think para preguntas difíciles. La ruta de voz es en la que más ingeniería hemos gastado. Es de la que más orgullosos estamos.
Ojos es la voz con una cámara. Ya estás en una llamada. Tocas el icono de cámara en el dock. Tu cámara trasera publica una pista de vídeo a nuestro worker a aproximadamente medio fotograma por segundo en resolución 768 píxeles. El worker empuja los fotogramas a la sesión Gemini Live en vivo. El modelo ahora ve lo que tú ves, en tiempo real, y lo describe en el mismo canal de voz. Lo usamos para boletines escolares bajo la lente de una madre que no sabe leerlos por sí misma. Lo usamos para facturas levantadas por comerciantes verificando las líneas. Lo usamos para un fuego de cocina donde el usuario filma la sartén y la IA dice «no uses agua, cubre la sartén, corta el gas» a tiempo para que importe.
Chat es texto con adjuntos. El usuario escribe un mensaje, adjunta una foto o un PDF, y la IA responde en texto. La canalización OCR pasa por Datalab Marker para el parseo principal y Mistral como fallback. El modelo de la ruta de respuesta es aquel al que OpenRouter nos enruta — DeepSeek V3 para K-12 económico, Claude o GPT-4o para razonamiento complejo Pro, Mistral para algunas rutas de visión y embedding. Chat es la más familiar de las tres superficies. También es la que más se beneficia de las otras dos: la usuaria inicia un hilo de chat sobre una tarea escolar, cambia a Voz cuando quiere que la IA lea la pregunta en voz alta, cambia a Ojos cuando quiere que la IA mire la solución trabajada de su hijo en papel. Las tres superficies son una sola conversación.
El hecho arquitectónico del que estamos orgullosos es que Voz, Ojos y Chat comparten un solo backend. Un usuario, un saldo de créditos, un historial de conversación, un contexto de prompt, un mismo conjunto de tool calls, tres modalidades de entrada. La decisión de construirlo así se tomó en noviembre de 2025 y es la razón por la que podemos entregar un producto que se siente como una sola IA en lugar de tres aplicaciones cosidas entre sí.
Para quién es Déblo
La frase de pitch que hemos usado internamente durante nueve meses y que ahora se vuelve externa: «No vendemos IA. Vendemos acceso a la experticia — a mil millones de personas que nunca lo tuvieron.»
La cifra de los mil millones es empíricamente defendible. Hay aproximadamente 1.400 millones de adultos en economías de ingresos bajos y medio-bajos que son funcionalmente analfabetos o que no dominan ninguno de los idiomas en los que se entregan los productos LLM dominantes (inglés, mandarín, español, francés como predeterminado de primera clase). Hay aproximadamente 600 millones de niños en esas mismas economías en primaria o secundaria. Hay aproximadamente 400 millones de comerciantes y artesanos del sector informal cuya actividad entera opera fuera de la pila de software de productividad alrededor de la cual fueron diseñados los productos LLM globales. Las poblaciones superpuestas se reducen a aproximadamente mil millones de individuos para los que una IA que solo funciona a través de un teclado, en inglés, con una tarjeta Visa para el pago y una conexión de banda ancha estable es funcionalmente inaccesible.
Déblo es la IA para ese usuario. Cada decisión de producto se calibra contra cuatro restricciones, en orden:
- Sin teclado. La voz es el punto de entrada principal. La pantalla de inicio es un solo botón de micrófono, no un compositor de chat. El usuario puede sostener una conversación durante una hora sin abrir jamás el teclado en pantalla. Para los usuarios que no saben leer ni escribir, esto es la diferencia entre una IA que existe y una IA que no existe.
- Sin inglés. El modelo habla el idioma que habla el usuario. El francés es plenamente de primera clase con el mismo presupuesto de fluidez y capacidad que el inglés. Los idiomas africanos locales (dioula, bambara, wolof, lingala, suajili, hausa) están soportados a través de la capacidad multilingüe subyacente de Gemini Live, y tenemos un andamiaje de prompts que garantiza que el modelo preserva el idioma de entrada en la respuesta en lugar de cambiar a inglés ante la incertidumbre. El posicionamiento de lanzamiento es «FR e EN canónicos, más los idiomas que tu teléfono ya entiende».
- Sin tarjeta de crédito. La recarga usa mobile money. Wave, Orange Money, MTN MoMo, Moov, Togocel — los raíles que la usuaria ya tiene en su teléfono para comprar crédito, pagar facturas de servicios y recibir dinero de familiares. Integramos a través de XPAYE y ZeroFee, que nos dan cobertura en seis países hoy (Costa de Marfil, Senegal, Malí, Burkina Faso, Togo, Benín) y una trayectoria de expansión regulatoria hacia quince más. Para iOS, donde Apple exige In-App Purchase para contenido digital, entregamos una billetera que acepta recargas Apple IAP en micro-USD y expone la misma experiencia de conversación.
- Sin alfabetización. Cada superficie de UI tiene un repliegue de voz. El usuario puede pedir a la IA que lea una pantalla en voz alta. El usuario puede pedir a la IA que rellene un formulario hablando. El usuario puede pedir a la IA que explique lo que hace un botón antes de tocarlo. Tenemos una categoría de accesibilidad — navegación de UI mediada por la voz — que la mayoría de las aplicaciones de consumo no se molestan en implementar porque sus usuarios objetivo saben leer. Déblo la trata como una capacidad de primera clase.
Estas cuatro restricciones no son «principios de diseño». Son el filtro de usuario que decide lo que entregamos. Cada propuesta de funcionalidad es interrogada: ¿requiere esto un teclado / inglés / una tarjeta / alfabetización? Si sí para cualquiera de ellos, la funcionalidad debe o bien desarrollar un repliegue, o bien esperar.
El trío que define el producto
Voz, Ojos y Chat son las tres modalidades. Son también las tres superficies de producto — cada una accesible desde la pantalla de inicio, cada una con su propio botón de entrada, cada una enrutando al mismo contexto de conversación del backend. La decisión de marcarlas como un trío en lugar de como un único «asistente de IA» se tomó en mayo de 2026 después de entregar la ruta de streaming de cámara (Fase 14) y darnos cuenta de que las tres modalidades son productos significativamente diferentes en la cabeza del usuario aunque compartan un backend.
El usuario dice «voy a preguntarle algo a Déblo» y aterriza en Voz. El usuario dice «voy a mostrarle algo a Déblo» y aterriza en Ojos. El usuario dice «voy a escribirle a Déblo» y aterriza en Chat. El verbo señala la superficie. El posicionamiento del producto respeta el verbo.
La nomenclatura fue deliberada. No usamos «Visión» para la superficie de cámara porque «AI Vision» está saturado en la industria — Apple Vision Pro, Google Cloud Vision, Claude/GPT/Gemini Vision. «Ojos» es más corto, más visceral, y señala lo que el usuario está haciendo (mostrarle algo a la IA) en lugar de lo que la IA está haciendo (procesar píxeles). La guía de estilo interna impone Déblo Voz / Déblo Ojos / Déblo Chat, en ese orden, con los acentos preservados (Déblo es D-e-acento-b-l-o, siempre). El trío es el producto. La audiencia es todo el mundo.
Las dos barreras defensivas
Nos han preguntado, al presentar Déblo a inversores en los últimos seis meses, qué impide que un entrante bien financiado de San Francisco haga lo mismo en dieciocho meses con más capital y más plantilla. La respuesta honesta son dos cosas, ambas compuestas:
Construido desde el punto de acceso, no desde la IA. Cada aplicación de IA de Silicon Valley se construye desde la IA hacia fuera. Empiezan con un modelo y añaden soporte de idiomas, luego soporte de pagos, luego accesibilidad, luego internacionalización, luego modos offline, luego localización. Están superponiendo accesibilidad sobre una IA ya construida. La decisión de soportar a un usuario que no sabe teclear, que no tiene tarjeta de crédito, que no habla inglés, que no sabe leer — esas decisiones se añaden en un decimocuarto sprint de producto, momento en el que la arquitectura es hostil a ellas.
Déblo se construyó desde el filtro de usuario. La primera decisión de producto fue voz como entrada principal, incluso antes de elegir el LLM. La segunda fue mobile money por encima de tarjetas de crédito, antes de construir el sistema de créditos. La tercera fue francés plenamente de primera clase, antes de escribir el primer prompt de sistema. La cuarta fue cámara en tiempo real para artefactos visuales, antes de entregar la Fase 14. La arquitectura está moldeada alrededor del usuario. Atornillar el mismo filtro de usuario sobre una IA teclado-inglés-tarjeta construida en San Francisco requiere reconstruir la arquitectura desde cero — y las arquitecturas construidas alrededor de restricciones que ya no se aplican a escala no son arquitecturas que uno reconstruya por deporte.
Los raíles de mobile money como ventaja operativa de dieciocho meses. Tenemos integraciones firmadas y transacciones en vivo con Wave, Orange Money, MTN MoMo, Moov y Togocel a lo largo de seis países. Cada integración es aproximadamente seis meses de trabajo operativo — KYC, presentaciones regulatorias, conciliación de liquidaciones, relaciones comerciales con socios, gestión de casos límite para recargas fallidas. Un equipo que empieza ese trabajo mañana está empezando un reloj de dieciocho meses que nosotros empezamos en octubre de 2024. Eso no es una barrera defensiva en el sentido de patente. Es una barrera defensiva en el sentido de plazo operativo. Para cuando un competidor tenga los raíles, nosotros tenemos dieciocho meses de producto adicional encima.
Estas dos barreras se componen. La barrera arquitectónica significa que un competidor no puede copiar el producto en un fin de semana. La barrera de los raíles significa que aunque pudiera, no puede entregar en nuestros mercados en menos de dieciocho meses. La intersección es la ventana que tenemos para adquirir usuarios, construir marca y acumular el aprendizaje operativo que se convierte en la tercera barrera (que no nombramos en el pitch deck porque es indefendible hasta que existe).
La metodología de ingeniería
Hay un hecho sobre cómo se construyó Déblo que no hemos publicitado porque no sabíamos cómo enmarcarlo de un modo que no sonara a truco. El hecho es: aproximadamente el 95 % del código de producción de Déblo fue escrito, revisado y commiteado por instancias de Claude Code corriendo en sesiones colaborativas con el fundador. El 5 % restante es configuración, infrastructure-as-code y el tipo de migración de base de datos puntual que es más rápido escribir a mano que dictar.
No nos avergonzamos de ello. Tampoco estamos haciendo una afirmación de marketing al respecto. La descripción honesta es que Déblo es el producto funcional de una metodología: un humano, una IA, propiedad plena, diario de build público. El diario de build es este blog. Veintiocho artículos previos recorren las grandes decisiones de ingeniería, los momentos de production-down, los bugs aplazados, las decisiones de arquitectura que tomamos y las que deberíamos haber tomado. La metodología tiene un nombre interno — Thales y su CTO de IA Claude — y un sitio público (thalesandhisaictoclaude.com) donde vive el diario de build.
La razón para nombrar la metodología ahora, en el artículo de lanzamiento público, es que la misma metodología construyó otros cuatro productos en paralelo durante los mismos quince meses: la herramienta de infraestructura interna de ZeroSuite, el compilador FLIN, el SaaS de pagos 0fee, el producto de vídeo VeoStudio. Déblo es el primero de ellos en entregarse a consumidores. La metodología no es un truco de Déblo; es una forma de construir software que creemos extensible a la mayoría de categorías de software, y sobre la que escribiremos más explícitamente en los meses posteriores al lanzamiento.
Para la audiencia de ingeniería que lee esto: sí, puedes construir aplicaciones de IA de consumo de calidad de producción con esta metodología. Tenemos quince meses de prueba. El diario de build está abierto. Las lecciones que pagamos en caídas de producción y rechazos de Apple están escritas. La metodología asume un fundador que puede sostener la visión de producto, juzgar los compromisos estratégicos y anular los valores por defecto del agente cuando el caso de uso lo exija. No asume que el fundador escriba también el código. El fundador escribe los prompts; la IA escribe los commits; el fundador revisa los diffs y entrega. La pareja es la unidad, no el agente.
A qué se parece el 1 de junio
El 1 de junio de 2026, suponiendo que la aprobación de Google Play aterrice en las próximas cuarenta y ocho horas, las acciones de cara al público son:
- Las fichas de App Store y Google Play pasan de «Pending Release» y «In Review» a «Ready for Sale» y «Live». Los usuarios de 173 países pueden descargar e instalar.
- La superficie de marketing pública —
deblo.aiypulse.deblo.ai(el portal de inversores que se entrega junto con la aplicación de consumo) — recibe un banner de lanzamiento. La página de precios que ha estado deliberadamente vacía en iOS por razones de cumplimiento recibe una superficie de precios real servida solo en Android y web. - El kit de prensa — el pitch de una página, el retrato del fundador, los dos vídeos de demo rodados en Abiyán con usuarios reales — se envía a los periodistas que estaban esperando una fecha.
- La primera cohorte de embajadores vernáculos — influencers comunitarios en Abiyán, Dakar, Bamako, Lomé, Cotonú — recibe los enlaces de demo y comienza a sembrar vídeos cortos mostrando casos de uso reales en lenguas locales.
- Los socios de ONG y educación que hemos firmado a lo largo de mayo activan sus canales de distribución: dispositivos en aulas en tres escuelas piloto (una en Abiyán, una en Dakar, una en Lomé), una alianza con una asociación que provee dispositivos a madres solteras en asentamientos informales, una alianza con una cámara de comercio que provee acceso de nivel Pro a sus miembros.
A lo que el 1 de junio no se parece es a una campaña de vallas, un momento Times Square o un lanzamiento Product Hunt. No optimizamos para la prensa tecnológica anglófona global porque la prensa tecnológica anglófona global no es nuestro usuario. Optimizamos para el aprendiz de mecánico en Adjamé, la comerciante del mercado de Sandaga, la madre de Abobo, la estudiante de Yopougon, el cliente de notaría de Treichville. El lanzamiento es local primero. La prensa tecnológica anglófona global oirá hablar de Déblo cuando la tracción local primero genere una historia que no pueda ignorar.
Los noventa días post-lanzamiento tienen una forma deliberada. Los primeros treinta días son estabilidad y observación — vigilancia con Sentry, monitorización de usuario real en las rutas de voz y cámara, entrevistas cualitativas con los primeros mil usuarios registrados. Los siguientes treinta días son las funcionalidades que faltan que pidieron los primeros mil usuarios. Los últimos treinta días son la expansión vertical Pro — Déblo Pro extendiendo el catálogo de agentes de 14 categorías hacia las verticales que generaron más altas de Pro en los primeros sesenta días. Para el 1 de septiembre, esperamos tener los datos para responder a las preguntas que el pitch deck responde actualmente con suposiciones informadas.
Qué significa esto para el diario de build
Esta serie del blog continuará. El lanzamiento no es el final de la historia de ingeniería; es el comienzo de un capítulo diferente. Los artículos previos al lanzamiento (este es el número 30 de la secuencia Cómo construimos Déblo) cubren cómo construimos cada gran capacidad. Los artículos post-lanzamiento cubrirán cómo operamos una IA de voz y cámara en tiempo real en producción para usuarios reales, en mercados donde el playbook SRE estándar no aplica porque el playbook SRE estándar asume regiones de nube estadounidenses y usuarios anglófonos en Verizon.
Esperamos escribir sobre: cómo Sentry se rompe cuando tu base de usuarios está en 3G intermitente, cómo se ven los presupuestos de latencia de voz de manera diferente cuando el viaje de ida y vuelta a europe-west1 de Vertex AI incluye un enlace satelital, cómo los fallos de recarga mobile money se agrupan por operadora y por hora del día, cómo el comportamiento de usuario en los primeros noventa días difiere de los supuestos que hicimos en el diseño de prompts, cómo las cuatro restricciones del filtro de usuario (sin teclado, sin inglés, sin tarjeta, sin alfabetización) sobreviven al contacto con las realidades de operar un negocio de consumo. Escribiremos sobre los éxitos cuando los tengamos y sobre las caídas cuando las tengamos. Seguiremos nombrando los bugs que encontramos y los bugs que se nos escaparon.
La superficie de inversores Pulse (pulse.deblo.ai) — el portal AI-nativo que da a nuestros inversores y socios acceso por voz y chat a KPI en vivo, cohortes de retención, telemetría de costes de GCP y al mismo catálogo de métricas que usa nuestro equipo interno — es el próximo artículo de esta serie (número 31). Pulse es interesante porque es el primer producto no de consumo que entregamos sobre la misma base Déblo, y la pregunta arquitectónica ¿puede una IA de voz en tiempo real escalar a analítica de cara a inversores? es una a la que queremos responder por escrito.
Conclusión
Déblo está, en el momento de escribir, a un clic de ser público en la App Store. El botón dice «Release This Version» en la página de distribución de App Store Connect para el build 1.0.6 (5). La aprobación equivalente de Google Play está en la misma ventana de revisión, sin señal de Google en un sentido u otro al momento de escribir — típico para un cambio mayor de ficha que añade 173 países y un segundo idioma de ficha al mismo tiempo que un bump de versionCode.
El plan es pulsar Release This Version el 1 de junio de 2026, después de que el smoke post-envío y la auditoría de solo lectura post-S255 estén limpios, y después de que aterrice la decisión de Google para que las dos tiendas entren en vivo en la misma ventana de cuarenta y ocho horas. El plan respeta la auditoría (una disciplina que nos debemos como higiene de lanzamiento) y respeta la decisión de tiendas paralelas (no queremos que una plataforma esté en vivo durante una semana antes de que la otra la alcance).
La tesis contra la que lanzamos es la del pitch a inversores, escrita aquí en español llano por primera vez en este blog: mil millones de personas están funcionalmente excluidas de la actual revolución de la IA porque cada producto de IA existente está construido alrededor de un usuario que sabe leer, que sabe teclear, que habla inglés y que tiene una tarjeta de crédito. Construimos la IA para los demás. El usuario es la comerciante, la madre, la estudiante, el mecánico, el aprendiz, el ama de casa, el cliente del notario, el aprendiz del comerciante. El producto es Voz más Ojos más Chat en una sola aplicación. La fecha de lanzamiento es el 1 de junio.
La historia de ingeniería detrás del lanzamiento son veintinueve artículos previos en este blog, de los cuales los dos más recientes son la reversión de privacidad de Apple y la sesión de envío de los once bugs en doble store. Esos dos artículos cubren cómo conseguimos las aprobaciones. Este artículo cubre por qué construimos la cosa en primer lugar. El próximo artículo cubre Pulse, el portal de IA de cara a inversores que se entrega sobre la misma base Déblo. Después de eso, comienza el capítulo operativo post-lanzamiento.
Agradecemos, en orden: a los cuatro usuarios de demo que nos dejaron probar el modal de consentimiento en iPhones reales, al revisor de Apple cuyos tres rechazos nos forzaron a entregar un mejor producto, a los socios de Wave y Orange Money que cargan con el peso del mobile money que hace real la distribución africana, a los equipos de ingeniería de LiveKit y de la organización Vertex AI de Google de cuya infraestructura en tiempo real dependemos, a OpenRouter y Anthropic y Mistral y Datalab y Sentry por estar nombrados en nuestro modal de consentimiento (y por ser los socios que estamos dispuestos a defender en público), y por encima de todo a los usuarios que descargaron los builds de TestFlight durante meses sin quejarse cuando la voz se cortaba al minuto ocho o cuando la funcionalidad Ojos alucinaba bajo mala iluminación.
Déblo abre sus puertas el 1 de junio. El trío Voz más Ojos más Chat está estructuralmente completo, aprobado por Apple y a un clic de ser público. Creado en Abiyán. Construido para el mundo.
Esta pieza fue escrita colaborativamente por Thales (CEO de ZeroSuite, construyendo Déblo y VeoStudio desde Abiyán, Costa de Marfil) y Claude Opus 4.7 — instancia de Claude Code corriendo en macOS, ventana de contexto 1M. El viaje de quince meses de construcción que resume comenzó en febrero de 2025 con un único prototipo voice-first sobre Expo SDK 51 y terminó en mayo de 2026 con una IA de voz y cámara en tiempo real sobre Expo SDK 54, React Native 0.81 New Architecture, backend FastAPI, ruta de voz en tiempo real LiveKit + Vertex AI, Postgres con pgvector para RAG, almacenamiento Hetzner compatible con S3, raíles de mobile money a través de XPAYE y ZeroFee, seis socios de IA de terceros divulgados en el modal de consentimiento (OpenRouter, Google Gemini Live, Anthropic Claude, Mistral, Datalab Marker, Sentry), y un diario de ingeniería público en thalesandhisaictoclaude.com que contiene veintinueve artículos previos. El correo de aprobación de Apple referenciado como detonante de este artículo está fechado 2026-05-29 06:34 PDT con ID de envío c3b52a78-73b9-4e1d-b3c4-ddfd2b03a744. La URL pública de App Store, que es permanente con independencia de cualquier cambio futuro de idioma principal, es apps.apple.com/app/d%C3%A9blo-ia-vocale-en-direct/id6766132651. La URL de Google Play es play.google.com/store/apps/details?id=ai.deblo.app y está, al momento de escribir, aún en revisión para la versión de producción 1.0.6 (2). La fecha de lanzamiento público, fijada el 20 de mayo y mantenida a través de tres revisiones de Apple y una revisión de Google Play, es el 1 de junio de 2026.