Bringen Sie die Außerbetriebnahme von Self-Service-Servern zu Dell IT

Die Außerbetriebnahme von Servern ist ein wesentlicher Bestandteil des Gerätelebenszyklusprozesses für jedes Unternehmen – und Dell Technologies ist da keine Ausnahme. Wie viele Unternehmen wollten wir dafür einen schnelleren, intelligenteren und effizienteren Weg finden.

Das war das Ziel, als unsere IT-Teams die Herausforderung annahmen, die Lebenszyklen von mehr als 120.000 Servern zu verwalten, die von Dell Technologies verwendet werden, um sicherzustellen, dass sie bei Bedarf effizient heruntergefahren werden.

Als das Produktteam für die Außerbetriebnahme von Dell Digital Servern mit diesen Bemühungen begann, hatte Dell Digital, die IT-Organisation von Dell, eine Mischung aus Außerbetriebnahmeprozessen. Wir sahen eine Möglichkeit, Prozesse zu standardisieren und Automatisierung anzuwenden, um die Effizienz zu steigern und die Stilllegungszeit zu verkürzen.

Die Außerbetriebnahme eines Servers bedeutet, ihn vom Netzwerk zu trennen und alle darin enthaltenen Daten zu löschen. Dies erfordert die Einbeziehung einer Vielzahl interner Teams, einschließlich Speicher-, Netzwerk-, Sicherheits- und IT-Engineering, die eine Reihe manueller Schritte ausführen.

Wenn die Bereinigung der Außerbetriebnahme von Servern nicht vollständig abgeschlossen ist, kann dies dazu führen, dass ungenutzte Server Rechenzentren überladen und unnötig Ressourcen wie Strom und IP-Adressen binden. Es kann auch Fälle geben, in denen Server möglicherweise wieder eingeschaltet werden und zu „verwaisten“ Servern werden, die von ihren Anwendungen getrennt werden, aber immer noch Platz in unserer Umgebung belegen.

Nach der Zusammenarbeit mit Anwendungseigentümern, Entwicklern und mehreren IT-Teams zur Analyse unserer Serverumgebung erstellte das Server Decommissioning Team einen automatisierten Self-Service-Prozess, um diese entscheidende Aufgabe der ordnungsgemäßen Außerbetriebnahme unserer Server zu verbessern. Das Team entwarf und implementierte das Self-Service-Stilllegungstool (SSD), das den Server-Stilllegungsprozess vollständig in einem Zehntel der Zeit früherer manueller Prozesse abschließt.

In den ersten sechs Monaten der Bereitstellung des Tools haben wir die Außerbetriebnahme unserer Server beschleunigt und Millionen von Dollar an Ressourcenkosten eingespart.

Hier sind einige Einblicke in unsere Bemühungen zur Außerbetriebnahme von Servern, die Ihrem Unternehmen helfen könnten, Server-Unordnung in Ihrer IT-Umgebung zu vermeiden.

Zusammenarbeit mit Stakeholdern, um den Prozess zu verfeinern

Das Team begann unsere Außerbetriebnahmeanalyse, indem es mehrere Quartale damit verbrachte, Aufzeichnungen und Prozesse zu recherchieren und mit Interessenvertretern zusammenzuarbeiten, um sich ein Bild von unserer Serverumgebung und dem bestehenden Prozess zu machen.

Wir haben festgestellt, dass es durchschnittlich 64 Tage dauerte, um den manuellen Server-Außerbetriebnahmeprozess durchzuführen, der sich über verschiedene Teams erstreckte.

Früher mussten Serverbesitzer einen Antrag stellen, um die Genehmigung zur Außerbetriebnahme ihrer Geräte innerhalb begrenzter Zeitfenster zu erhalten. Unser Änderungsmanagementteam überprüfte Anfragen wöchentlich, um sicherzustellen, dass es keine Moratorien oder Produktionskonflikte gab, und autorisierte dann die Eigentümer, mit den Aktivitäten zum Herunterfahren des Servers zu beginnen. Verschiedene Faktoren können dazu führen, dass Antragsteller Wochen oder sogar Monate warten, bevor sie mit dem Prozess beginnen können.

Die Außerbetriebnahme war ein sehr manueller Prozess und umfasste verschiedene Teams, um die vielen Aufgaben zu bewältigen, wie z. B. das Zurückfordern von Speichervolumes, das Entfernen von mit dem Server verknüpften Sicherungsdaten, das Löschen zugehöriger virtueller Maschinen von unserer VM-Konsole und vieles mehr. Dell Digital Domain Name Service recycelt wertvolle IP-Adressen, die immer nur begrenzt verfügbar sind.

Erstellen eines Self-Service-Pfads

Nachdem wir den bestehenden Prozess festgelegt hatten, begann das Server-Außerbetriebnahme-Team mit der IT, dem Änderungsmanagement und den Dell Digital Zero Touch Engineering-Teams zusammenzuarbeiten, um einen automatisierten Außerbetriebnahme-Prozess zu erstellen. Unser oberstes Ziel war es, es Teams einfacher und effizienter zu machen, Hardware aus unserer Umgebung zu entfernen.

Wir haben einen hybriden Ansatz gewählt, bei dem Stilllegungsanträge einen neu erstellten Workflow durchlaufen, der automatisch auf Konflikte und Berechtigungen prüft. Wenn keine Konflikte festgestellt werden, erteilt der Prozess die Stilllegungsgenehmigung. Unser neues automatisiertes Außerbetriebnahme-Tool (ADT), das vom Zero Touch Engineering Team entwickelt wurde, übernimmt den eigentlichen Außerbetriebnahmeprozess, einschließlich des Self-Service-Server-Shutdowns, der Serverstatusvalidierung und des Löschens von VMs.

Unter dem neuen Prozess wird die Dienstabschaltung automatisch ausgelöst, sobald eine Anfrage den automatischen Genehmigungsworkflow durchlaufen hat. Da es keine eingeschränkten Zeitfenster für die Außerbetriebnahme mehr gibt, kann ein Server jetzt in nur 24 Stunden heruntergefahren werden.

Das SSD verfolgt den Fortschritt jeder Anfrage und hält die Antragsteller über den Status ihrer Anträge auf dem Laufenden. Der vereinfachte, nahtlose und schnellere Prozess hat die SLAs für unsere Teammitglieder erheblich verbessert und macht Serverbesitzer für das Schicksal ihrer Geräte verantwortlich.

Durch die Anwendung der Automatisierung haben wir mehr Server schneller außer Betrieb genommen und die Probleme mit verwaisten Servern behoben. Es hat zur Rückgewinnung von 53.000 TB Festplatte und 364 TB Arbeitsspeicher geführt. Dies hat zu Einsparungen in Millionenhöhe geführt.

Wenn Ihr Unternehmen den Prozess der Außerbetriebnahme von Servern verbessern möchte, ist mein dringendster Rat, keine Angst vor der Komplexität Ihrer bestehenden Umgebung zu haben. Führen Sie die Analyse durch, um den aktuellen Status Ihres Ökosystems zu bestimmen. Arbeiten Sie mit Stakeholdern und Ihren IT-Teams zusammen, um dieses quälende Problem zu lösen, das andernfalls weiter zunehmen würde.

Die Einrichtung eines automatisierten Self-Service-Server-Stilllegungsprozesses kann Teammitglieder entlasten, damit sie sich auf das Wesentliche konzentrieren können, Kosteneinsparungen durch die Rückgewinnung von Ressourcen erzielen und, was vielleicht am wichtigsten ist, dazu beitragen, Cybersicherheitslücken für Ihr Unternehmen zu verringern.

Bleiben Sie über unsere Dell Digital-Strategien und mehr auf dem Laufenden Dell Technologies: Unsere digitale Transformation.

Author: admin

Leave a Reply

Your email address will not be published. Required fields are marked *