Éteignez vos serveurs

8. January 2025

TL;DR Éteignez vos serveurs. Utilisez le Scream Test. Adressez les craintes. Passez aux Lightswitch Ops.

Un moyen simple de réduire vos émissions de CO2 (et d’économiser de l’argent au passage) est d’éteindre vos serveurs ! Probablement pas tous et pas définitivement, mais il existe certainement des machines qui ne sont pas pleinement utilisées. Vous connaissez probablement un ou deux serveurs qui traînent depuis des mois sans que personne ne les utilise, ou des machines qui ne sont utilisées que pendant les heures de bureau.

La consommation d’énergie d’un serveur en veille représente toujours une part significative de sa consommation maximale.

Proportionnalité énergétique gsf source green software foundation

Le Scream Test

Déterminer si un serveur est encore utilisé peut sembler une tâche complexe, surtout lorsque les informations de propriétaire sont obsolètes ou inexistantes. Mais Microsoft a trouvé une solution : le Scream Test.

Vous pouvez probablement imaginer comment cela fonctionne. Éteignez un serveur dont vous suspectez qu’il n’est jamais ou rarement utilisé, et attendez que quelqu’un se manifeste et se plaigne.

Microsoft décrit leur processus comme suit :

What’s the Scream Test? Well, in our case it was a multistep process:

  1. Display the message “Hey, is this your server, contact us?” on the sign-in splash page for two weeks.
  2. Restart the server once each day for two weeks to see whether someone opens a ticket (in other words, screams).
  3. Shut down the server for two weeks and see whether someone opens a ticket. (Again, whether they scream.)
  4. Retire the server, retaining the storage for a period, just in case.

Microsoft a ainsi pu éteindre 15% de ses serveurs. C’est une réduction significative de la consommation d’énergie et une importante économie de coûts.

Serveurs avec un calendrier

Dans votre organisation, il existe certainement des serveurs qui ont un calendrier fixe d’utilisation. De nombreux services ne sont nécessaires que pendant les heures de bureau et peuvent être éteints en dehors de ces heures. Même si ces services ont des exigences de disponibilité élevées, cela peut ne s’appliquer que pendant des heures définies.

Une chose à prendre en compte avec de tels systèmes sont les traitements par lots. Ceux-ci sont souvent exécutés la nuit. Si vous éteignez les systèmes à ce moment-là, ils ne peuvent évidemment pas s’exécuter. Vous devez les déplacer dans le temps de fonctionnement prévu et prévoir suffisamment de temps pour qu’ils se terminent. Ou peut-être est-il possible de les exécuter pendant quelques heures de faible charge durant la journée ?

Tenez également compte des dépendances possibles lorsque vous planifiez d’arrêter des systèmes en dehors des heures normales. Un autre service ou système pourrait dépendre de la machine que vous souhaitez éteindre et fonctionner selon un calendrier différent.

Et si elle ne redémarre pas ?

C’est une préoccupation légitime qui empêche beaucoup de personnes d’éteindre des machines. Réfléchissez-y ainsi : préféreriez-vous découvrir des problèmes potentiels lors d’un test contrôlé dans vos propres conditions ? Ou préférez-vous faire cette découverte lors d’un incident, quand le serveur tombe en panne au pire moment ?

La clé est d’aborder l’arrêt de manière systématique. Gardez des registres détaillés sur quels serveurs sont arrêtés, pourquoi et quand. En appliquant un processus comme dans le Scream Test (redémarrages réguliers), vous pouvez vous assurer que les machines reviennent en ligne.

Lightswitch Ops

Si vous pouvez mettre tout cela en œuvre de manière systématique et cohérente, cela s’appelle les « Lightswitch Ops ». Cette méthode traite la gestion des serveurs avec la même simplicité que d’appuyer sur un interrupteur — les ressources sont allumées et éteintes selon les besoins réels. Pour que les Lightswitch Ops prennent vraiment racine dans votre organisation, il est crucial de surmonter les craintes et les incertitudes souvent associées à l’arrêt des serveurs.

En commençant simplement et en étendant progressivement le processus à de plus en plus de serveurs, vous pouvez renforcer la confiance et finalement en faire une habitude. Les Lightswitch Ops devraient être votre objectif final et non le premier pas (dans la Green Software Maturity Matrix, cette étape arrive au niveau 3 et non dès le début).

Conclusion

L’arrêt des serveurs inutilisés ou sous-utilisés est une étape simple qui peut réduire considérablement la consommation d’énergie et les coûts opérationnels. En identifiant où cette pratique est applicable et en la mettant en œuvre de manière systématique, vous pouvez contribuer à un paysage informatique plus durable.

Des petites mesures, comme l’arrêt d’un serveur inutilisé, peuvent avoir un grand impact. Alors demandez-vous : tous vos serveurs sont-ils vraiment nécessaires en ce moment ? Si non, il est temps de les éteindre et de faire un pas vers un avenir plus vert.