Approche en quatre étapes de l’IA-Ops pour un plus grand succès dans le Cloud
avril 27, 2020 / Suzanne Taylor
Notre étude Cloud Success BarometerTM montre que le niveau de réussite d’une entreprise dans le Cloud est directement lié à l’adoption ou non d’un engagement fondamental avancé envers le Cloud lui-même. En d’autres termes, s’ils ne font pas du cloud une priorité, les projets échouent. D’après mon expérience, deux obstacles clés se présentent souvent : un mauvais engagement dans le cloud et trop d’opérations manuelles. Dans le premier cas, le client a très peu de champions du cloud qui sont partisans de la transformation du cloud. Sur de tels sites, les initiatives cloud s’effondrent au fil du temps en raison d’un manque d’enthousiasme et ne sont pas réalisées. Cependant, les opérations sont souvent négligées comme un autre responsable de la « destruction du cloud », mais elles peuvent également stagner et même arrêter l’innovation dans le cloud.
Comment ? Une fois le cloud déployé, il faut un ensemble différent d’outils et de processus pour gérer efficacement les opérations, mais les outils et procédures appropriés du centre de données peuvent manquer dans le cloud nouvellement déployé. Un client récent me vient à l’esprit. Après une migration d’une charge de travail Azure, les tests ont généré une multitude de tickets d’incident, à attendre après le démarrage initial. Trouver les causes profondes de ces incidents de démarrage requiert de l’expérience en matière de migration et d’opérations dans le Cloud, ce qui manque dans de nombreuses entreprises. Nos experts CloudForte® Center of Excellence ont été en mesure de résoudre rapidement la plupart des problèmes, en sachant exactement à quoi s’attendre et ce qu’il faut rechercher dans cette migration de routine. Cependant, la plupart des sites clients ne disposent pas d’une telle expertise. Et face à des lots récurrents d’incidents, ils peuvent réfléchir deux fois à tenter une autre migration. Nous avons économisé des heures et des heures de temps, de tracas et de frustration potentielle en résolvant rapidement la majorité des tickets d’incident.
Chez Unisys, nous automatisons l’ensemble de ce processus en utilisant des outils et l’intelligence artificielle pour améliorer les opérations. Nous avons constaté que de nombreux tickets d’incident peuvent être systématiquement identifiés et résolus automatiquement à l’aide de l’IA, en réservant des incidents de haute priorité et plus complexes à une intervention manuelle et humaine. Il s’agit essentiellement de « regrouper » notre expertise dans des systèmes automatisés. Dans la plupart des cas, sur une base quotidienne, la majorité des tickets d’incident couramment trouvés peuvent et doivent être résolus à l’aide de l’IA et de l’automatisation, ce qui réduit considérablement le nombre de tickets et le temps de résolution. Cette approche prédictive et proactive des opérations permet d’économiser du temps et de l’argent et de renforcer le « moral du cloud. »
Nous travaillons sur une approche en quatre étapes pour nos opérations d’IA :
1) Collecter des données opérationnelles, telles que notre expérience de « nouvelle migration
2) Introduisez ces données dans le moteur d’apprentissage automatique (ML)
3) Générer des résultats spécifiques à partir du ML, puis
4) Intégrez les données dans la gouvernance.
De cette manière, un grand pourcentage d’incidents peuvent être résolus grâce à l’IA et à l’automatisation, réservant des incidents plus importants à l’intervention humaine. Parallèlement, les incidents sont résolus plus rapidement et les erreurs humaines sont réduites. En rationalisant et en automatisant les opérations grâce à l’IA prédictive et proactive, les entreprises ont un obstacle en moins à leur réussite continue dans le Cloud.