Back to deblo
deblo

Tâches de fond : quand l'IA met 30 minutes à réfléchir

Architecture queue-bridge avec tâches asyncio détachées, suivi de progression Redis, annulation coopérative et nettoyage des jobs obsolètes pour la génération IA longue durée.

Juste A. Gnimavo (Thales) & Claude | March 26, 2026 3 min deblo
EN/ FR/ ES
deblotâches-de-fondasyncioredisgénérationqueue

Par Thales & Claude -- CEO & AI CTO, ZeroSuite, Inc.

Une experte-comptable à Abidjan demande à Deblo Pro de générer un rapport financier annuel complet conforme au SYSCOHADA -- avec bilan, compte de résultat, analyse des flux de trésorerie, notes annexes et commentaire de gestion. L'ensemble du processus prend 12 minutes.

Douze minutes est une éternité en temps d'application web. La connexion SSE du navigateur aura expiré après environ 180 secondes. Si la génération dépend d'une connexion HTTP active entre le navigateur et le serveur, ce rapport de 50 pages meurt à mi-chemin.

La solution : architecture queue-bridge

Nous avons implémenté une architecture queue-bridge avec des tâches asyncio détachées. Au lieu de lier la génération à la connexion HTTP, nous les découplons.

Le flux : l'utilisateur envoie un message avec background=true. Le backend crée un enregistrement GenerationJob dans PostgreSQL avec le statut pending. Le backend lance une asyncio.Task détachée. Le backend retourne immédiatement le job_id au frontend (HTTP 202 Accepted). Le frontend interroge GET /api/jobs/{job_id} toutes les 3 secondes pour vérifier la progression.

Suivi de progression dans Redis

Interroger PostgreSQL toutes les 3 secondes depuis chaque client connecté serait coûteux. Nous utilisons Redis comme cache de progression rapide avec un TTL d'une heure. Le endpoint de polling vérifie d'abord Redis. Si le job est terminé ou échoué, il se rabat sur PostgreSQL pour le résultat complet.

Annulation

Les jobs longue durée doivent être annulables. Le mécanisme d'annulation utilise Redis comme canal de signalisation : quand l'utilisateur clique « Annuler », le frontend envoie un POST qui positionne une clé Redis. La tâche de fond vérifie cette clé entre les itérations. C'est de l'annulation coopérative -- la tâche n'est pas tuée en pleine exécution.

Nettoyage des jobs obsolètes

Un redémarrage du serveur pendant un job actif crée un orphelin. Le nettoyage tourne au démarrage de l'application et marque tout job running ou pending comme failed avec le message « Le serveur a redémarré pendant la génération. »

Pourquoi pas Celery ?

Trois raisons : simplicité opérationnelle (Deblo est une opération à deux personnes), la charge de travail est limitée par le LLM (un seul event loop asyncio peut gérer des dizaines de tâches en attente concurrentes), et nous n'avons pas besoin d'exécution distribuée pour le moment.

Les chiffres

  • Durée moyenne des jobs : 4,2 minutes
  • Job réussi le plus long : 28 minutes
  • Taux d'échec : 3,1 %
  • Taux d'annulation : 8,7 %

La fonctionnalité a transformé Deblo Pro d'un outil conversationnel en une plateforme de génération de documents.


Ceci est l'article 11 de 20 dans la série « Comment nous avons construit Deblo.ai ».

Share this article:

Responses

Write a response
0/2000
Loading responses...

Related Articles

Thales & Claude thales

Treize agents, quarante-trois minutes : la première session Workflow de Claude Fable 5, et ce qu'un script d'orchestration déterministe change aux builds multi-agents

Un prompt, treize agents, quarante-trois minutes : la première session de production avec Claude Fable 5 et l'outil Workflow de Claude Code a livré un site web de production complet de sept pages plus un endpoint backend de capture de leads, en un seul commit. Le carnet de bord : le script d'orchestration déterministe, le patron d'injection de contrat entre les phases, l'économie par agent du fan-out parallèle, et le suspense de la limite de session que le journal de reprise a transformé en non-événement.

23 min Jun 12, 2026
claude-fable-5claude-codeworkflow-toolmulti-agent +10
Thales & Claude casp

La porte a détecté sa propre dérive : une journée dans CASP avec Claude Fable 5

Nous avons confié au modèle Claude le plus autonome à ce jour les clés de CASP — le CLI open source qui garde les agents de code IA honnêtes face à git — avec l'autorité de rejeter notre propre roadmap. Il a rejeté cinq choses, trouvé deux vrais bugs dans le validateur en le dogfoodant, les a corrigés sous une porte à deux auditeurs, et a laissé casp check entièrement vert sur son propre dépôt pour la première fois. CASP 0.3.0 en est le résultat.

16 min Jun 10, 2026
caspzerosuiteworkflowai-cto +9
Thales & Claude zerosuite

La transplantation du CASP : comment la discipline des six fichiers est passée de Conductor à un ERP transport anti-fraude, ce que la compétence /next ajoute quand l'opérateur tape juste « next », et pourquoi le coût d'une dérive du CASP grimpe quand le projet, c'est l'argent des autres

La discipline du CASP qui a piloté trente-cinq sessions de Conductor est agnostique au produit. Le carnet de bord de sa transplantation sur KASSIA, un ERP transport anti-fraude pour un exploitant de flotte en Côte d'Ivoire : ce qui a migré, ce qui n'a pas migré (le validateur sur mesure — et ce que son absence coûte), ce que la compétence /next ajoute quand l'opérateur tape un seul mot, et là où le CASP s'arrête — le bug de déploiement qu'il ne pouvait pas voir parce qu'il enregistre l'intention, pas la réalité de l'infrastructure.

23 min Jun 8, 2026
kassiaerp-kassia-transport-logistiquezerosuiteCASP +15