Back to sh0
sh0

Autoscaling en Rust : seuils CPU, cooldowns et répartition de charge

Comment nous avons construit la mise à l'échelle horizontale avec la répartition de charge Caddy, la gestion de conteneurs répliqués, et un autoscaler avec des cooldowns configurables.

Juste A. Gnimavo (Thales) & Claude | March 26, 2026 1 min sh0
EN/ FR/ ES
autoscalingload-balancingcaddyrustcontainersdevops

Un PaaS qui ne peut pas scaler est un PaaS avec un plafond. Nous avons construit la mise à l'échelle horizontale avec la répartition de charge Caddy, la gestion de conteneurs répliqués, et un autoscaler qui évalue les seuils CPU/mémoire avec des cooldowns configurables.

L'autoscaler évalue périodiquement les métriques des conteneurs, compare avec les seuils configurés, et décide d'ajouter ou de supprimer des réplicas. Les cooldowns empêchent les oscillations -- pas de scale-up pendant les 60 premières secondes après un scale-down, et vice versa.

Caddy gère la répartition de charge entre les réplicas via des upstreams multiples dans la configuration du reverse proxy. Quand un nouveau réplica est ajouté, la configuration Caddy est reconstruite avec l'IP additionnelle.


Prochain dans la série : Multi-serveur BYOS : tunnels SSH, transfert d'images et Trust On First Use.

Share this article:

Responses

Write a response
0/2000
Loading responses...

Related Articles

Thales & Claude deblo

Le jour où Déblo a refusé une bonne réponse — deux fois

Une trace de production a montré Déblo K12 rejetant deux fois de suite la bonne réponse d’un élève de Terminale. Huit heures d’analyse, quatre commits, une rotation A/B de modèles et un benchmark sur 6 modèles plus tard, le tuteur de maths était corrigé. Ce qui a cassé, ce que nous avons changé, et ce que l’échec surprenant de GPT-5.4-mini au test socratique nous a appris sur le choix des modèles pour l’IA éducative.

32 min May 3, 2026
debloclaude-opus-4.7claude-codemethodology +14
Thales & Claude deblo

Web Claude a trouvé le bug. Puis il a failli l’aggraver.

Comment un prompt vocal de 270 lignes pour le tuteur Ultravox de Deblo produisait la même phrase d’accueil scriptu00e9e à chaque appel. Web Claude a diagnostiqué le problème parfaitement, puis a prescrit une correction qui aurait doublé la taille du prompt avec des hooks backend inexistants. Le filtre qui a gardé le diagnostic et rejeté la prescription.

17 min Apr 28, 2026
debloclaude-opus-4.7methodologyprompt-engineering +7
Thales & Claude deblo

Pourquoi j’ai dû corriger Web Claude deux fois sur la stratégie de la page d’accueil de Deblo

Comment une conversation de 48 heures avec Web Claude a failli entraîner Deblo dans le piège généraliste « ChatGPT pour l’Afrique », et pourquoi la connaissance du marché par le fondateur a dû prendre le dessus sur les suggestions stratégiques de l’IA à deux reprises.

26 min Apr 26, 2026
debloclaude-opus-4.7methodologystrategy +6