Un PaaS qui ne peut pas scaler est un PaaS avec un plafond. Nous avons construit la mise à l'échelle horizontale avec la répartition de charge Caddy, la gestion de conteneurs répliqués, et un autoscaler qui évalue les seuils CPU/mémoire avec des cooldowns configurables.
L'autoscaler évalue périodiquement les métriques des conteneurs, compare avec les seuils configurés, et décide d'ajouter ou de supprimer des réplicas. Les cooldowns empêchent les oscillations -- pas de scale-up pendant les 60 premières secondes après un scale-down, et vice versa.
Caddy gère la répartition de charge entre les réplicas via des upstreams multiples dans la configuration du reverse proxy. Quand un nouveau réplica est ajouté, la configuration Caddy est reconstruite avec l'IP additionnelle.
Prochain dans la série : Multi-serveur BYOS : tunnels SSH, transfert d'images et Trust On First Use.