Évoluez plus intelligemment avec un hyperscaler : l'auto-scaling horizontal et en cluster simplifié

mise à l'échelleautomatisation des infrastructuresl'allocation des ressourcesautomatisation

14 octobre 2025

Anita Okem-Achu

Rédacteur technique

Cet article est également disponible en anglais.

Les pics de trafic, qu'ils soient liés au lancement d'un produit ou au Black Friday, ne doivent pas entraîner le plantage de votre application ni saturer votre capacité de stockage et votre mémoire vive. C'est là qu'intervient l'autoscaling intelligent. Il permet de maintenir la rapidité des applications et de contrôler les coûts en ajoutant ou en supprimant des instances d'application en fonction de l'évolution de la demande. Plutôt que d'estimer une taille fixe, la plateforme surveille les signaux en temps réel et ajuste automatiquement les ressources.

Les applications modernes ne se contentent pas d'ajouter des serveurs supplémentaires pour résoudre un problème. Elles ont besoin de stratégies de mise à l'échelle sophistiquées, capables de distinguer les pics temporaires de la croissance soutenue, de mettre à l'échelle chaque composant de manière indépendante et de maintenir les performances dans plusieurs environnements cloud. La clé réside dans la compréhension de deux approches fondamentales de la mise à l'échelle : la mise à l'échelle horizontale et la mise à l'échelle automatique des clusters.

Mise à l'échelle horizontale vs mise à l'échelle de cluster

La mise à l'échelle des applications n'est pas une solution universelle. Des charges de travail différentes nécessitent des stratégies différentes, et les implémentations de mise à l'échelle les plus efficaces combinent plusieurs approches pour créer des systèmes résilients et rentables.

La mise à l'échelle horizontale consiste à ajouter des instances supplémentaires à vos conteneurs d'application afin de répartir la charge. Plutôt que de passer à un serveur plus puissant, la mise à l'échelle horizontale crée des instances d'application identiques supplémentaires qui se partagent le trafic entrant. Cette approche fonctionne particulièrement bien pour les applications sans état, où n'importe quelle instance disponible peut traiter chaque requête.

La mise à l'échelle des clusters, en revanche, opère au niveau de la couche infrastructurelle, en ajustant automatiquement le nombre de nœuds de calcul disponibles pour vos applications. Lorsque vos instances d'application ont besoin de plus de ressources que votre cluster actuel ne peut en fournir, la mise à l'échelle automatique des clusters provisionne des nœuds supplémentaires. À l'inverse, lorsque la demande diminue, elle supprime les nœuds sous-utilisés afin de réduire les coûts.

Vous vous demandez probablement : qu'en est-il alors de la mise à l'échelle verticale ? La mise à l'échelle verticale adopte une approche différente en augmentant la puissance des serveurs existants, en ajoutant davantage de CPU, de RAM ou de stockage aux machines dont vous disposez déjà. Au lieu d'exécuter plusieurs copies de votre application, vous allouez davantage de ressources à vos instances d'application actuelles afin de gérer l'augmentation de la charge. Cela fonctionne bien pour les applications qui ne peuvent pas être facilement divisées en plusieurs instances, telles que les bases de données ou les applications avec une gestion d'état complexe. Cependant, le dimensionnement vertical a ses limites : la quantité de CPU et de RAM pouvant être ajoutée à un seul serveur est limitée, et il n'offre pas la même tolérance aux pannes que le dimensionnement horizontal, car vous dépendez toujours de machines individuelles.

Examinons un exemple qui nous parle à tous.

Pensez à un voyage en voiture. Normalement, votre famille de 4 personnes voyage confortablement dans une berline. Aujourd'hui, vous organisez une réunion et devez transporter 20 personnes à la plage. La mise à l'échelle verticale consiste à prendre un véhicule plus grand ; échangez votre berline contre un grand bus pouvant transporter les 20 personnes en un seul trajet.

D'autre part, la mise à l'échelle horizontale consiste à conserver votre berline et à acquérir quatre voitures identiques supplémentaires. Vous disposez désormais de cinq berlines pouvant transporter un total de 20 personnes (4 personnes par voiture). Si une voiture tombe en panne, les quatre autres peuvent toujours effectuer le trajet, et les passagers peuvent se répartir entre les voitures.

Avec la mise à l'échelle automatique des clusters, vous recrutez trois autres membres de votre famille qui savent conduire. Désormais, chacune de vos cinq voitures a un conducteur et les 20 personnes peuvent voyager efficacement.

Examinons de plus près les autoscalers de cluster.

Principes fondamentaux de l'autoscaling de cluster

Dans les environnements cloud traditionnels, le cluster autoscaling fonctionne au niveau de la couche infrastructure, en ajustant automatiquement le nombre de nœuds de calcul en fonction des demandes des applications. Lorsque vos applications ont besoin de plus de ressources que vos nœuds actuels ne peuvent en fournir, un cluster autoscaler provisionne des nœuds supplémentaires. Lorsque la demande diminue, il supprime les nœuds sous-utilisés afin de réduire les coûts.

L'autoscaler de cluster surveille en permanence les demandes de ressources et les besoins de planification dans toute votre infrastructure. Les implémentations modernes utilisent des algorithmes qui prennent en compte des facteurs tels que les demandes de planification de pods en attente, les modèles d'utilisation des nœuds et les besoins en ressources des applications pour prendre des décisions de mise à l'échelle. Cela permet d'éviter à la fois les pénuries de ressources et le surprovisionnement inutile.

L'intégration entre la mise à l'échelle horizontale des pods et la mise à l'échelle automatique des clusters crée un écosystème de mise à l'échelle complet dans les environnements Kubernetes. Lorsque les applications ont besoin de plus d'instances mais que les nœuds existants manquent de capacité, les pods restent en attente jusqu'à ce que le cluster autoscaler provisionne des nœuds supplémentaires pour les accueillir.

Cependant, la gestion de l'autoscaling des clusters nécessite une expertise dans les opérations Kubernetes, les intégrations des fournisseurs de cloud et une configuration minutieuse des politiques de mise à l'échelle, des pools de nœuds et des contrôles de coûts. Cette complexité opérationnelle est l'une des raisons pour lesquelles de nombreuses équipes préfèrent les plateformes gérées qui gèrent automatiquement la mise à l'échelle de l'infrastructure.

L'avantage des hyperscalers dans les environnements multicloud

Par « hyperscaler », nous entendons les grands fournisseurs de cloud, tels qu'AWS, Google Cloud et Microsoft Azure, qui exploitent d'énormes parcs de machines dans plusieurs régions. Leur valeur est simple : une capacité quasi instantanée et une présence mondiale lorsque vous en avez besoin. Leur réseau mondial de centres de données, leurs capacités d'orchestration avancées et leurs services gérés créent l'environnement idéal pour mettre en œuvre des stratégies de mise à l'échelle intelligentes. Cependant, avec leurs services, vous devrez toujours connecter des groupes de nœuds, des autoscalers et des métriques.

Upsun fonctionne sur AWS, Azure et Google Cloud Platform, donnant à vos applications accès à une infrastructure hyperscaler tout en éliminant la complexité liée à la gestion de plusieurs environnements cloud. Cette approche multicloud offre plusieurs avantages pour les opérations de mise à l'échelle.

Tout d'abord, elle élimine les problèmes de dépendance vis-à-vis d'un fournisseur, qui limitent souvent les décisions de mise à l'échelle. Vos applications peuvent tirer parti des meilleures fonctionnalités de chaque hyperscaler sans compromettre l'architecture. AWS peut offrir les services d'autoscaling les plus aboutis, Google Cloud peut fournir la meilleure intégration Kubernetes et Azure peut offrir une intégration d'entreprise supérieure. Avec Upsun, vous n'avez pas à choisir entre l'un ou l'autre.

Deuxièmement, le déploiement multicloud permet une distribution géographique qui améliore à la fois les performances et la résilience. Vos utilisateurs européens peuvent être desservis depuis les régions européennes d'Azure, tandis que votre trafic asiatique transite par l'infrastructure Asie-Pacifique de Google Cloud. Desservez les utilisateurs à partir du fournisseur et de la région de votre choix. Si vous avez besoin d'une haute disponibilité multirégionale, exécutez des projets dans plusieurs régions et placez une couche de routage CDN ou DNS en amont.

Troisièmement, l'optimisation des coûts devient plus sophistiquée dans un environnement multicloud. Différents hyperscalers proposent différents modèles de tarification pour le calcul, le stockage et la mise en réseau. Le placement intelligent des charges de travail peut réduire considérablement les dépenses opérationnelles tout en maintenant les exigences de performance.

Comment fonctionne l'autoscaling sur Upsun

Upsun offre une grande flexibilité grâce à la mise à l'échelle horizontale et verticale, ce qui vous permet de choisir l'approche la mieux adaptée à chaque situation. Dans la console actuelle, la mise à l'échelle automatique est basée sur la moyenne du CPU. La mise à l'échelle automatique basée sur la mémoire est en cours de développement. Lors des pics de trafic, la mise à l'échelle automatique de la console ajoute ou supprime automatiquement des instances d'application selon les règles que vous avez définies. Lorsque vous avez besoin de plus de puissance par instance, vous pouvez ajuster le CPU, la RAM et le disque pour chaque conteneur, y compris les bases de données et les caches.

Évolutivité horizontale sur Upsun

La mise à l'échelle horizontale sur Upsun est gérée par une fonctionnalité de mise à l'échelle automatique intégrée. Upsun ajoute ou supprime des instances d'application pour répondre à la demande en temps réel. Plutôt que de devoir surveiller votre application et ajouter manuellement des instances supplémentaires lorsque le trafic augmente, Upsun suit la moyenne du CPU de votre application et ajuste le nombre d'instances selon les règles que vous avez définies.

Voici comment cela fonctionne : Upsun surveille la moyenne CPU de toutes les instances de votre application. Si le CPU reste à 80 % ou plus pendant 5 minutes consécutives, il lance automatiquement une autre instance pour aider à gérer la charge. Lorsqu'il y a un changement et que le CPU tombe en dessous de 20 %, il attend 5 minutes, puis supprime les instances supplémentaires. Les limites d'instances par défaut sont généralement de 1 à 8 par environnement, bien que les valeurs exactes varient selon les régions.

Vous pouvez configurer cela directement depuis la console en cliquant sur « Configurer les ressources », puis sur « Activer » dans la colonne « Autoscaling ». À partir de là, vous pouvez décider :

Instances minimales: combien de copies de votre application doivent toujours être en cours d'exécution (généralement à partir de 1)
Instances maximales: le nombre maximal d'instances que vous souhaitez, afin que les coûts ne deviennent pas incontrôlables (généralement 1 à 8 par environnement, selon votre région)
Quand augmenter/réduire la capacité: vous pouvez ajuster ces seuils de CPU si 80 % et 20 % ne conviennent pas à votre application.
Durée d'attente: période d'évaluation (1 à 60 minutes) avant d'effectuer des modifications, afin que les pics temporaires ne déclenchent pas de mise à l'échelle inutile.
Temps de refroidissement: combien de temps attendre entre deux actions de mise à l'échelle (la valeur par défaut est de 5 minutes) pour éviter que le système n'ajoute et ne supprime constamment des instances.
Pas de mise à l'échelle à zéro: La mise à l'échelle automatique ne réduira pas une application à 0 instance ; définissez votre minimum pour définir la base de référence.

Une fois la mise à l'échelle automatique activée, vous ne pouvez plus définir manuellement le nombre d'instances. Upsun s'occupe de tout dans les limites que vous avez définies. Cependant, vous pouvez ajuster la quantité de CPU, de RAM et de disque attribuée à chaque instance, mais le nombre d'instances devient automatique.

Gardez à l'esprit que l'autoscaling ne fonctionne actuellement que pour les applications.

Exemple rapide : si votre boutique exécute généralement deux instances d'application, l'autoscaler ajoutera des instances dès que l'utilisation du CPU dépassera 80 % pendant 5 minutes et continuera jusqu'à ce que la demande se stabilise ou atteigne le maximum que vous avez configuré. Considérez « 8 » comme une limite standard par défaut, et non comme une garantie, car les limites varient selon les régions.

La beauté de cette approche réside dans son fonctionnement transparent. Étant donné que la mise à l'échelle horizontale implique l'ajout ou la suppression d'instances, Upsun déploie la modification, qui utilise des minutes de compilation. Chaque action de mise à l'échelle consomme des minutes de compilation, car les instances nouvelles ou supprimées sont déployées avec l'action de mise à l'échelle. Si votre application est fréquemment mise à l'échelle, cela peut augmenter l'utilisation des minutes de compilation. Veillez à ce que les périodes d'évaluation restent raisonnables afin d'éviter des changements fréquents et de contrôler les coûts en évitant des paramètres de mise à l'échelle trop agressifs.

Mise à l'échelle verticale sur Upsun

Parfois, vous n'avez pas besoin de plus d'instances, mais simplement de donner plus de puissance à vos instances existantes. Avec la mise à l'échelle verticale, vous procédez essentiellement à une mise à niveau matérielle de votre application existante : plus de CPU, plus de RAM ou plus d'espace de stockage, plutôt que de créer des instances supplémentaires.

Cette approche fonctionne très bien lorsque vous avez affaire à des bases de données ou à des applications qui ne fonctionnent pas bien lorsqu'elles sont réparties sur plusieurs instances. Considérez ceci : l'exécution de plusieurs instances de base de données semble une excellente idée jusqu'à ce que vous réalisiez que vous devez désormais synchroniser toutes ces données, ce qui devient rapidement compliqué. Il est beaucoup plus simple d'allouer plus de RAM et de puissance CPU à votre instance de base de données unique.

Upsun propose quatre profils de conteneurs différents qui vous offrent diverses combinaisons de CPU et de RAM, en fonction des besoins de votre application :

HIGH_CPU - Plus de puissance de traitement pour les tâches gourmandes en calcul
BALANCED - Un mélange équilibré de CPU et de RAM pour les applications web classiques
HIGH_MEMORY - RAM supplémentaire pour les applications qui doivent conserver beaucoup de données en mémoire
HIGHER_MEMORY - Encore plus de RAM pour les charges de travail gourmandes en mémoire

Vous pouvez ajuster ces ressources à tout moment via la console ou l'interface CLI. L'enregistrement des modifications verticales redéploie l'environnement (temps d'arrêt court) et chaque instance reçoit la totalité du CPU et de la RAM que vous sélectionnez. Cela fonctionne très bien pour les services tels que les bases de données, les caches ou les applications qui ne peuvent pas facilement répartir leur travail entre plusieurs instances. Au lieu d'essayer d'exécuter plusieurs instances de base de données (ce qui peut devenir compliqué en raison de problèmes de cohérence des données), vous pouvez simplement allouer plus de RAM et de CPU à votre instance de base de données unique pour gérer la charge accrue.

Vous pouvez combiner les deux, utiliser la mise à l'échelle verticale pour votre base de données et la mise à l'échelle horizontale pour votre application web, le tout dans le même projet. Upsun gère l'allocation des ressources par environnement, ce qui vous permet d'allouer plus de puissance à votre base de données de production qu'à celle de développement, tout en maintenant des coûts raisonnables.

Conclusion

Upsun fonctionne différemment des configurations Kubernetes traditionnelles. Alors que les autoscalers de cluster s'appliquent aux clusters autogérés, Upsun gère automatiquement toute la mise à l'échelle de l'infrastructure en arrière-plan. En tant qu'utilisateur, vous vous concentrez sur la mise à l'échelle horizontale et verticale de vos applications, tandis qu'Upsun gère pour vous la capacité de l'infrastructure sous-jacente.

Pour réussir l'autoscaling, il ne suffit pas d'activer une fonctionnalité ; vous devez comprendre le comportement réel de votre application, sélectionner les bons indicateurs à surveiller et ajuster en permanence les paramètres en fonction de ce qui se passe réellement en production. Les plateformes telles qu'Upsun facilitent grandement cette tâche en gérant automatiquement les aspects complexes de l'infrastructure, ce qui vous permet de vous concentrer sur la création d'applications performantes plutôt que de vous débattre avec les configurations de mise à l'échelle.

À mesure que vos applications se développent, votre approche de mise à l'échelle doit évoluer en conséquence. La mise en œuvre d'une mise à l'échelle automatique intelligente se traduit par de meilleures performances, une réduction des coûts et la capacité de s'adapter rapidement lorsque les besoins de votre entreprise changent ou que de nouvelles opportunités se présentent.

Les applications qui réussiront sont celles qui peuvent évoluer intelligemment, en s'adaptant automatiquement à la demande tout en maîtrisant les performances et les coûts. Avec la bonne plateforme et la bonne approche, vos applications peuvent gérer toute croissance, quelle qu'elle soit.

Évoluez plus intelligemment avec un hyperscaler : l'auto-scaling horizontal et en cluster simplifié

Mise à l'échelle horizontale vs mise à l'échelle de cluster

Principes fondamentaux de l'autoscaling de cluster

L'avantage des hyperscalers dans les environnements multicloud

Comment fonctionne l'autoscaling sur Upsun

Mise à l'échelle verticale sur Upsun

Conclusion

Restez informé

Votre meilleur travail
est à l'horizon

Évoluez plus intelligemment avec un hyperscaler : l'auto-scaling horizontal et en cluster simplifié

Mise à l'échelle horizontale vs mise à l'échelle de cluster

Principes fondamentaux de l'autoscaling de cluster

L'avantage des hyperscalers dans les environnements multicloud

Comment fonctionne l'autoscaling sur Upsun

Mise à l'échelle verticale sur Upsun

Conclusion

Restez informé

Votre meilleur travail.css-2vew0q{display:inline-block;background:rgb(250, 65, 255);background:linear-gradient(90deg, #806bff 0%, #ed49f0 100%);-webkit-background-clip:text;-webkit-background-clip:text;background-clip:text;-webkit-text-fill-color:transparent;}est à l'horizon

Votre meilleur travail
est à l'horizon