Los equipos de TI trabajan bajo presión frente a la batalla contra la avalancha de alertas continuas
- Opinión
Las organizaciones de todo el mundo están en pleno proceso de transformación digital y trabajando para ofrecer experiencias más satisfactorias a los clientes. Para ello, necesitan llevar a cabo innovaciones constantes y de forma rápida para satisfacer sus expectativas.
José Matias Regional Director para Iberia de Dynatrace |
Conseguir este objetivo requiere migrar cada vez más servicios a entornos híbridos nativos de la nube. Estos ecosistemas dinámicos brindan un nivel notable de agilidad a las organizaciones, pero también introducen niveles de complejidad sin precedentes. De hecho, investigaciones recientes demuestran que administrar toda esta complejidad supera las capacidades humanas.
Los equipos de TI reciben un constante bombardeo de alertas de rendimiento y disponibilidad que deben de investigar para identificar y resolver posibles problemas antes de que afecten el rendimiento de los servicios y reduzcan la satisfacción de los usuarios y clientes. Ante un volumen tan alto de alertas, los equipos de TI invierten un promedio del 15% de su tiempo tratando de identificar en cuáles deben centrarse. Esto les cuesta a las organizaciones una media anual de 1.5 millones de dólares, incluso antes de ponerse a resolver el problema.
Un futuro complejo
Gran parte del desafío al que se enfrentan los actuales equipos de TI radica en el hecho de que las aplicaciones que se ejecutan en los ecosistemas de nube empresariales son enormemente complejas, con cientos de tecnologías, millones de líneas de código y miles de millones de dependencias entre ellas. Todo esto está produciendo un volumen, velocidad y variedad de datos de monitorización y alertas de rendimiento sin antecedentes y los métodos tradicionales de monitorización de aplicaciones ya no son suficientes para dar sentido al volumen de datos y proporcionar el nivel de observabilidad que los equipos de TI necesitan para administrar el rendimiento del servicio de manera efectiva.
En gran parte, este desafío se debe al hecho de que los sistemas de monitorización tradicionales generalmente operan de manera aislada. El resultado es que envían miles de alertas individuales que carecen del contexto más amplio de lo que está ocurriendo en todo el stack. Por lo tanto, los equipos de TI reciben un gran número de falsos positivos y alertas duplicadas que deben ser analizadas antes de poder continuar con el trabajo de resolver problemas.
Los equipos de TI, enfrentados a este constante aluvión de datos e incapaz de enfocarse de inmediato en problemas de rendimiento genuinos, dedican cada vez más tiempo a determinar hacia dónde deben dirigir sus esfuerzos y esta tarea se vuelve aún más engorrosa por el hecho de que la mayoría de las alertas son irrelevantes, tan sólo el 26% de estas requiere acción según afirman los propios responsables de estos departamentos.
Ahogarse en tormentas de alerta
Ordenar los falsos positivos, los duplicados y las alertas de baja prioridad de los problemas genuinos es un proceso lento y propenso a errores. Esto significa que los equipos de TI tienen menos tiempo para tareas más importantes, como identificar la causa raíz de los problemas de rendimiento y solucionarlos antes de que los clientes o usuarios finales sufran interrupciones en el servicio. En la era actual del cliente, donde tenemos muchas opciones y oportunidades para cambiar a un servicio alternativo en un abrir y cerrar de ojos, esto puede conducir a una pérdida de ingresos y perjudicar el resultado final para las organizaciones. Los usuarios esperan una experiencia digital perfecta y, para poder ofrecerla, los equipos de TI deben poder mantener la capacidad de observación de extremo a extremo. Sólo así podrán gestionar eficazmente sus entornos de TI cada vez más complejos, con la capacidad de identificar y resolver problemas de rendimiento antes de que se vea afectada la calidad del servicio.
Claramente, el estatus quo es insostenible, y se necesita un cambio radical para aliviar la presión sobre los equipos de TI. Los recursos críticos que los equipos están actualmente desperdiciando en la clasificación de miles de alertas de rendimiento deben ser redirigidos hacia una gestión de rendimiento efectiva y para impulsar experiencias digitales sin interrupciones. Algunas organizaciones están intentando resolver el problema actualizando sus herramientas, pero es una opción limitada ya que estas herramientas no se crearon para la naturaleza dinámica de los entornos de nubes múltiples. Domar la complejidad de estos ecosistemas requiere un cambio que va más allá de confiar sólo en las capacidades humanas.
Operaciones impulsadas por IA
Las organizaciones necesitan hacer la transición de operaciones a la nube impulsadas por la inteligencia artificial para controlar sus entornos complejos y seguir teniendo éxito en un mundo centrado en la experiencia del usuario. La combinación de esto con un enfoque global de datos comunes que rompe los silos entre los datos de monitorización ofreciendo un soporte mucho mejor para los equipos de TI, brindándoles respuestas precisas y totalmente contextualizadas a los problemas de rendimiento, en lugar de más datos y alertas. Esto allanará el camino hacia aplicaciones de auto reparación automática mediante la automatización de la entrega continua de actualizaciones y los procesos operativos.
En última instancia, los líderes de TI y de empresas deben abordar la insuficiencia de los sistemas de monitorización tradicionales que están ahogando a los departamentos de TI en alertas implacables. Las empresas de hoy necesitan hacer un cambio decisivo hacia las operaciones en la nube impulsadas por IA que brindan información procesable sobre el rendimiento de sus aplicaciones y el impacto en el usuario final. Sólo así podrán ofrecer experiencias digitales sin problemas en medio de la complejidad de la nube empresarial y seguir siendo competitivos en un mundo centrado en el cliente.
Puedes ver la ponencia de Dynatrace en este Foro IT User en este enlace.