Enfrentando los Retos de la Operación Proactiva de la Nube

Publicado en

La administración de los servicios de una aerolínea es compleja y altamente dinámica. Miles de pasajeros y piezas de equipaje se mueven continuamente entre cientos de aviones. Es complicado dar un seguimiento a todos estos detalles a la vez que se asegura que los clientes reciban la mejor experiencia. También se pueden tener alianzas con otras aerolíneas para cubrir más destinos, y la coordinación de esto añade aún mayor complejidad. Como si todo esto no fuera suficiente, está operación se da en un entorno en el que los problemas de recursos, como los problemas mecánicos de los aviones y el personal limitado, pueden hacer lentas sus operaciones y reducir la satisfacción de sus clientes.

De manera similar, el entorno operativo de la nube es complejo y está en constante cambio. Miles de cargas de trabajo se mueven entre cientos, o incluso miles, de servidores físicos, y dar seguimiento a estos detalles y asegurar el rendimiento óptimo de los usuarios finales es difícil. Tal vez tu organización utiliza servicios de múltiples fuentes, algunas internas y otras externas. Además, el personal y los recursos de TI insuficientes, así como un rendimiento de los servicios por abajo del nivel óptimo, pueden tener un efecto negativo enorme en el negocio. Para amplificar estos retos, se tiene la necesidad de combinar las operaciones de TI locales (in-house) con las de la nube por medio de una estructura unificada de centro de datos.

Las organizaciones de TI que desean ser exitosas en este contexto requieren adoptar un modelo de administración de operaciones flexible y proactivo para la implementación y entrega de servicios de TI de calidad.

Operaciones proactivas en la nube y BSM

Para administrar proactivamente los entornos de nube, se requiere superar cuatro desafíos importantes. Primero, debes entender tu entorno. Esto requiere reunir, consolidar, analizar y actualizar los datos de diversas fuentes, algunas internas y otras externas. Al mismo tiempo, debes mantener el control en un entorno altamente volátil, un entorno que está cambiando de forma continua y rápida en cuanto a estructura y cargas de trabajo. Adicionalmente, tienes que lidiar con el “efecto dominó” ya que un solo cambio o problema puede afectar cientos de servicios. Finalmente, debes automatizar la administración de solicitudes de servicio de manera que puedas responder rápidamente a cientos de solicitudes de servicio de los usuarios; proveer y administrar los servicios solicitados para cumplir con los niveles de servicio esperados; y hacer todo esto sin violar las políticas internas o las regulaciones externas.

Las soluciones Business Service Management (BSM) pueden ayudar a hacer frente a estos cuatro desafíos. BSM brinda un modelo unificado que ayuda a los departamentos de TI a reducir los costos, disminuir el riesgo, y mejorar la rentabilidad del negocio. Las soluciones BSM ofrecen una variedad de servicios de automatización, administración y analítica que permiten administrar los entornos de nube de manera proactiva. A continuación describimos cuatro estrategias que te pueden ayudar a hacer frente a estos desafíos.

1. Entiende tu entorno: Reúne, consolida y analiza los datos

Para administrar efectivamente el centro de datos moderno e híbrido, necesitas saber que hay “allá afuera”. Esto significa conocer qué activos físicos, virtuales y de nube se tienen y cómo encajan entre sí. Tener disponible esta información en todo momento es un gran desafío debido a la gran cantidad y variedad de recursos de cómputo, almacenamiento y comunicación que se utilizan en las organizaciones modernas. También es posible que en esta información se requiera incluir datos de los servicios provistos por recursos externos, como los proveedores de nubes públicas y de servicios administrados.

El desafío está en consolidar, normalizar y analizar los datos para tener un panorama completo y unificado del rendimiento en tiempo real de todos sus servicios TI. Algunos proveedores de servicio externos han puesto a disposición interfaces de programación de aplicaciones (APIs) que le permiten aprovechar los datos de su infraestructura. Sin embargo, los datos expuestos por estas APIs tal vez no sean suficientemente granulares para sus propósitos, así que posiblemente tenga que hacer deducciones de acuerdo con el análisis de los datos disponibles.

Las soluciones BSM pueden ayudar a cumplir con estos requerimientos. Primero, las soluciones BSM para descubrimiento y mapeo de dependencias reunen datos de fuentes dispares, los reconcilian, normalizan y consolidan en un solo repositorio de datos unificado (por ejemplo, una base de datos de administración de configuraciones, o CMDB) que puede ser compartido por distintas herramientas de administración de servicios. Algunas soluciones pueden analizar los datos de las aplicaciones y la infraestructura en tiempo real para crear y mantener automaticamente modelos de servicio en tiempo real que muestren las relaciones entre los recursos de TI internos y externos, y los servicios de negocio que soportan.

Al mismo tiempo, las soluciones BSM pueden monitorear en tiempo real el rendimiento y disponibilidad de estos recursos. Las soluciones más avanzadas sincronizan en tiempo real las relaciones de modelos de servicios con la CMDB para asegurar que los modelos de servicio permanezcan actualizados de modo que puedan tomarse decisiones de TI precisas y oportunas. Estas soluciones pueden reunir y analizar datos provenientes de una gran variedad de recursos, incluso de proveedores de nube externos. De esta forma, las organizaciones de TI obtienen una vista completa de todos los recursos que soportan los servicios que ofrecen, y en caso de haber un problema pueden detectarlo con precisión y en tiempo real.

2. Manten el control del entorno dinámico

La virtualización, que brinda la base para el cómputo de la nube, ha elevado considerablemente la naturaleza dinámica del centro de datos. En el centro de datos moderno los recursos están virtualizados, incluyendo servidores, redes, aplicaciones y almacenamiento. Conforme las cargas de trabajo y requerimientos del negocio cambian, estos recursos son continuamente reconfigurados y aprovisionados. El centro de datos dinámico afecta diversas áreas de las operaciones virtuales y de nube.

Descubrimiento. Es importante actualizar continuamente la vista del entorno para estar al día con los rápidos cambios de su configuración. Las soluciones de descubrimiento automático y de mapa de dependencias pueden ayudar a analizar continuamente el entorno, manteniendo actualizados los datos de las aplicaciones y la infraestructura, y actualizando los modelos de servicio por consiguiente. Además, algunas soluciones de administración del rendimiento complementan la CMDB y las soluciones de descubrimiento al detectar los cambios en el entorno de monitoreo en tiempo real y notificar a la CMDB para reconciliar los cambios y asegurar siempre la precisión en casi tiempo real de los modelos de servicio.

Gestión del cambio y configuración. Otra área que afecta el centro de datos dinámico es la administración de los cambios y las configuraciones. Debemos asegurar que todos los cambios, sin importar lo rápido que ocurran, cumplan con las políticas internas y las regulaciones externas. Asimismo, hay que asegurar que los procesos de administración de los cambios no limiten la agilidad en los entornos virtuales y de nube. En resumen, necesitamos proveer rápidamente los recursos con la seguridad de que sean aprobados adecuadamente y usen sólo las configuraciones estándares. También necesitamos rastrear los cambios para propósitos de auditoría. Una vez más, las soluciones de administración de cambios y de configuraciones puedan ayudarle a superar el reto. Estas soluciones BSM automatizan un proceso de cambio de circuito cerrado que engloba la aprobación, la programación, la implementación, la verificación y el rastreo de los cambios. Al integrar la gestión de configuración y la del rendimiento, las soluciones BSM permiten que las operaciones de nube evalúen de inmediato el impacto que los recientes cambios en las configuraciones tienen en los niveles de servicio.

Operaciones. La naturaleza dinámica del entorno de nube también complica las operaciones. En primer término, requerimos conocer cuándo ocurren los cambios en caso de que provoquen problemas de rendimiento. Los analistas de la industria reportan que el 80 por ciento de las interrupciones de servicio son causadas por cambios configurados de forma inadecuada. En segundo término, debido al volumen y frecuencia del cambio, en los ambientes virtualizados y en la nube no es viable configurar manualmente umbrales estáticos ni recurrir a tendencias de rendimiento. Las cargas de trabajo varían según la hora del día, la semana, el mes y el año. Algunos cambios son predecibles, definidos por el “ritmo” natural del negocio, otros son definidos por factores incidentales, como las ofertas promocionales. Los umbrales deben ajustarse de forma constante y automática de acuerdo con todos estos factores.

Para complicar las cosas, la naturaleza fundamental de los entornos virtuales y de nube es de un alto volumen de cambios, lo cual requiere ajustarse rápidamente a cambios en las necesidades de capacidad. En consecuencia, también necesita conocer y dar seguimiento a los ritmos normales de los cambios de la capacidad, así como conservar el aprendizaje del comportamiento cuando ocurren los movimientos para soportar estos cambios. Sólo así usted puede distinguir entre las fluctuaciones normales y anormales, y eliminar las alertas falsas.

Las soluciones BSM facilitan determinar cuando un cambio reciente de la configuración es la causa de raíz de un problema de rendimiento. También, automáticamente aprenden y dan seguimiento a los cambios en los entornos virtuales y de nube. Sin esta tecnología, sería imposible realizar manualmente el análisis para determinar cuándo los cambios impactan a los niveles de servicio en los entornos dinámicos virtuales y de nube. Finalmente, las soluciones de administración de sistemas BSM ajustan los umbrales de modo automático y dinámico de acuerdo con el análisis en tiempo real de patrones de las cargas de trabajo. Al aprender los ritmos del negocio y el entorno de TI que los soportan, eliminan mucho del ruido de las herramientas tradicionales que generan alertas basadas en umbrales estáticos.

3. Lidia con el “efecto dominó”

Los entornos virtuales y de nube incrementan exponencialmente el impacto de los problemas de rendimiento, ya que entre más servicios se hospeden en un recurso compartido mayor será el impacto cuando ocurran problemas en dicho recurso. Y eso no es todo, también hay que tomar en cuenta el impacto de los servicios dependientes entre sí. Por ejemplo, un servicio puede construirse combinando otros servicios. Así, un problema en cualquier servicio puede tener un “efecto dominó” en muchos otros servicios, algunos de los cuales funcionan sobre otros recursos físicos. Este efecto dominó es particularmente complicado para los proveedores de nubes públicas porque están atendiendo a un gran número de clientes, multiplicando el impacto de los problemas.

El efecto dominó ejerce una gran presión en el personal de TI para estar pendiente de todos los servicios y recursos. Eso requiere la capacidad de monitorear de cerca los niveles de servicio para los servicios internos y aquellos provistos por recursos externos. Asimismo, requiere de la capacidad de atender rápidamente los problemas detectados, resolviendo los incidentes antes de que se deriven en la degradación del rendimiento o interrupciones. Por ejemplo, debe ser capaz de detectar, diagnosticar, priorizar y resolver rápidamente los incidentes, dirigiéndoles a los equipos indicados, algunos de los cuales pueden ser externos.

Puede utilizar las soluciones BSM para monitorear los recursos físicos, virtuales y de nube y ofrecer una notificación oportuna de los problemas inminentes. Incluso, estas soluciones pueden evaluar y priorizar automáticamente los problemas de acuerdo con su impacto en los servicios. Algunas soluciones generan automáticamente tickets de problemas y anexan información sobre la causa de raíz y el impacto en los servicios para ayudar a acelerar la priorización de los problemas, el diagnóstico y la resolución. Estas soluciones trabajan junto con las soluciones BSM de administración de incidentes, cambios y problemas que conducen los incidentes de la detección a la resolución.

Es necesario administrar con cuidado la capacidad para lograr una alta utilización de los recursos sin reducir la calidad de servicio. Esto requiere entender los patrones y tendencias de las cargas de trabajo para poder asegurar que la capacidad suficiente esté disponible cuándo y dónde se necesita. Las soluciones BSM pueden realizar un análisis de los datos del negocio, de las aplicaciones, de la infraestructura y de las cargas de trabajo para asegurar que la capacidad exacta se proporcione para cada servicio. Algunas soluciones se integran con las soluciones de administración y automatización de sistemas TI para facilitar la capacidad diaria para asegurar el rendimiento óptimo de los servicios. También pueden realizar un análisis “hipotético” que le ayude a determinar y planear los futuros requerimientos de capacidad. Con estas soluciones, usted puede brindar la capacidad que necesita –hoy y a futuro- sin gastar más de la cuenta los recursos de capital y operativos.

4. Automatiza la gestión de solicitudes

Una de las capacidades principales de los entornos de nube es que los usuarios puedan solicitar servicios por medio de un portal de autoservicio. Las organizaciones de TI deben atender rápidamente las solicitudes sin descuidar el cumplimiento de las políticas internas y regulaciones externas. Por ejemplo, debe proveer sólo los servicios a los que el usuario solicitante está autorizado a acceder de acuerdo con su rol en la organización. Además, los servicios pueden tener diferentes niveles de privilegio, dependiendo del rol del usuario. Asimismo, puede tener que proveer el servicio usando configuraciones estándares, y necesita rastrear el aprovisionamiento para propósitos de auditoría.

Las soluciones BSM pueden determinar los niveles de privilegio de los usuarios y configurar y proveer los servicios solicitados. Asimismo, rastrean las solicitudes desde la captura hasta la ejecución y permiten a los usuarios monitorear el estatus de sus solicitudes. Además, las soluciones despliegan y configuran automaticamente las herramientas requeridas junto con el servicio, asegurando que se cumplan los niveles de servicio adecuados. Por ejemplo, si un nivel de servicio oro se solicita para un servicio, la herramienta puede configurarse para medir la experiencia de los usuarios finales junto con los periodos especificados para resolver cualquier fallo de rendimiento de los usuarios finales.

Conclusión

Al abordar los cuatro desafíos de las operaciones de nube proactivas, las organizaciones de TI pueden cumplir la promesa del cómputo en la nube en el ámbito empresarial. Dichas organizaciones pueden usar sus activos de TI de forma más efectiva para obtener el máximo retorno de su inversión. Gran parte de las tareas operativas y administrativas se pueden automatizar para reducir costos y proveer los más altos niveles de servicio.

Bio

Ajay Singh es VicePresidente de Service Assurance en BMC Software.

Leslie Minnix-Wolfe es gerente de producto de Service Assurance en
BMC Software.