Listado de Productos

  • Articulo Técnico - Delta
  • Articulo Técnico

     

    Gestión Eficiente de la Infraestructura de Ingeniería del Centro de Datos

    Las herramientas para la automatización de las tareas de control y monitoreo en los centros de datos son relativamente nuevas en el mercado. Los primeros productos de este tipo ofrecían varias características, incluido el mantenimiento de registros de equipos y el control de movimiento y mantenimiento. Hoy, no se trata solo de dibujar hermosos diagramas de sala de servidores conectados a una base de datos. Los sistemas modernos de hoy le permiten resolver una gran variedad de tareas relacionadas con la operación de un centro de datos en tiempo real. En este artículo, veremos los problemas que surgen en esta industria y trataremos de encontrar formas de resolverlos.

     

    Escalando la Diversidad

    Dos circuitos de control pueden ser distintos en la infraestructura de ingeniería de un centro de datos. Uno se ocupa del enfriamiento a nivel de gabinete y la distribución de energía, mientras que el otro trabaja a nivel de toda la instalación y se ocupa no solo de la energía y el aire acondicionado, sino también con varios subsistemas auxiliares (extinción de incendios, control de acceso). y otra). A menudo, estos circuitos e incluso sus componentes son independientes entre sí y son operados por diferentes equipos de operadores.

    Las empresas no siempre están dispuestas a comprar soluciones integradas para la gestión de la infraestructura de ingeniería. En general, los centros de datos comerciales no tienen esta opción. Sin embargo, en el segmento corporativo, no es raro que la administración de la compañía intente ahorrar dinero y acepte incluir solo sistemas de aire acondicionado y UPS fragmentados en la estimación. La falta de comunicación entre los circuitos de control, los diferentes niveles de automatización de los subsistemas del centro de datos y una flota de diferentes proveedores de equipos complican el trabajo coordinado de todas las partes de la instalación, haciendo imposible la optimización.

     

    Modos de Control

    En el peor de los casos, los subsistemas del centro de datos se controlan manualmente y la instalación y el movimiento del equipo se documentan con Microsoft Excel. El papeleo es a menudo un desastre, lo cual es bastante natural, ya que mantener una base de datos correcta usando hojas de cálculo es una tarea muy difícil. Cuando el número de gabinetes se mide en decenas, los problemas con la contabilidad manual son inevitables. El reemplazo del equipo en un centro de datos ocurre solo cuando ocurre una falla, lo que aumenta los gastos generales y el tiempo de inactividad en caso de accidente.

    Si el tiempo de inactividad es crítico para los propietarios de centros de datos, se utiliza el modelo de control reactivo. En este caso, el procedimiento de solución de problemas está regulado y se mantiene la documentación adjunta. Sin embargo, el proceso se basa en la experiencia de los empleados y el conocimiento de un centro de datos específico. En caso de accidente, el problema se elimina lo suficientemente rápido, pero existen serias dificultades con la prevención debido a la falta de oportunidades para un análisis exhaustivo de las causas de un mal funcionamiento. En una situación en la que solo unos pocos especialistas saben cómo manejar todos los procesos de gestión de las instalaciones, y en el caso, por ejemplo, de un especialista despedido, surgen nuevos problemas.

    Un modelo de gestión más avanzado siempre está orientado al servicio. Asume el papeleo completo, cubriendo todos los subsistemas de una instalación. Define claramente las reglas y procedimientos para el reemplazo de equipos y el mantenimiento preventivo y mantiene un registro completo de su instalación y movimiento, mientras que los servicios operativos preparan informes sobre parámetros del sistema de ingeniería, accidentes y acciones tomadas por el personal para eliminarlos.

    La característica clave del enfoque orientado a servicios para la gestión de centros de datos es la proactividad. Este modelo no solo le permite analizar las causas de los errores, sino que también anticipa los problemas antes de que ocurran. Se pueden establecer soluciones alternativas para restaurar rápidamente la disponibilidad del servicio. Obviamente, este enfoque es imposible sin la introducción de un único sistema automatizado de monitoreo y despacho para todos los subsistemas críticos del centro de datos. La práctica muestra que las acciones de los empleados a menudo causan fallas. Siempre hay una escasez de especialistas altamente calificados, pero si el centro de despacho está automatizado y se formalizan todas las reglas y regulaciones de mantenimiento de las instalaciones, la mayoría del personal solo necesitará conocimientos básicos.

     

    Monitoreo y Despacho

    Hace unos diez años, aparecieron en el mercado las soluciones DCIM (Datacenter Infrastructure Management), que combinan todos los subsistemas de ingeniería en un marco lógico, aparecieron en el mercado. Las primeras versiones de DCIM permitieron elaborar esquemas/planes de objetos y mantener el papeleo, pero ahora su funcionalidad ha cambiado significativamente. Las soluciones modernas pueden interactuar con herramientas de monitoreo integradas en equipos de diferentes fabricantes y conectar sensores, controladores, convertidores de señal y sistemas de recolección de datos adicionales. En la mayoría de los casos, se recopila información sobre el consumo de energía en todos los niveles, hasta el nivel del gabinete, la temperatura y la humedad en recintos, sistemas de enfriamiento y conductos internos, así como datos de fugas de fluidos. Es el mínimo necesario para lograr el objetivo previsto.

    Cuando DCIM está en su lugar, el cliente recibe un entorno integrado de monitoreo y control que incluye todos los subsistemas críticos e incluso equipos de TI en algunos casos. Su tarea principal es combinar flujos de datos del número máximo de fuentes disponibles. La información se recopila y procesa en tiempo real, lo que proporciona al personal de servicio una imagen completa de cómo funcionan todos los subsistemas del centro de datos, incluida, si es necesario, su potencia informática. Aquí es donde vemos otra ventaja de DCIM, que es la reducción del impacto de los factores humanos en el rendimiento de los subsistemas del centro de datos.

     

    El problema de la Elección

    Puede haber diferentes escenarios para su introducción, pero es mejor definir la DCIM en la etapa de diseño de la instalación. También hay opciones para integrar subsistemas independientes existentes utilizando equipos de diferentes fabricantes. Elegir una solución en la etapa de diseño del centro de datos no causa problemas; Esto generalmente lo realiza un integrador de sistemas que lo ayuda a elegir el hardware y el software necesarios.

    La situación con un centro de datos existente es mucho más complicada. En este caso, será necesario convocar un grupo de trabajo, que incluya representantes de todos los departamentos interesados. Debe enumerar todos los parámetros y nodos de infraestructura que se supervisarán y organizarlos en orden descendente de importancia. Luego es necesario auditar los protocolos y medios soportados por el equipo de infraestructura, así como considerar qué sensores y controladores adicionales deberán instalarse.

    Con toda esta información, puede seleccionar las soluciones de software requeridas, enumerar equipos adicionales y calcular el presupuesto del proyecto. Es una gran idea externalizar completamente la introducción de DCIM al objeto existente. Los errores en la etapa de diseño costarán más que los servicios de creación de sistemas. Inicialmente, los sistemas DCIM eran locales, pero ahora muchos desarrolladores están comenzando a ofrecerlos como un servicio (SaaS). Este enfoque permite una reducción significativa en los gastos de capital.

     

    Puntos de Optimización

    El elemento principal en la estructura de gastos operativos del centro de datos es el costo de la electricidad. El funcionamiento de los equipos informáticos y los sistemas de refrigeración genera altas facturas de electricidad. Por lo tanto, optimizar el consumo de energía es una prioridad. Esto depende de una gran cantidad de factores externos e internos. Por ejemplo, el clima y las condiciones climáticas, incluidos los cambios estacionales, afectan directamente los sistemas de enfriamiento. También puede agregar picos y caídas en las cargas de equipos informáticos y de telecomunicaciones y docenas de otros matices. Es imposible tenerlos en cuenta todos manualmente, pero el sistema DCIM le permitirá acumular estadísticas operativas reales y analizarlas, identificando áreas problemáticas en la infraestructura de la instalación.

    Uno de los indicadores más críticos para un centro de datos es la Eficiencia en el Uso de Energía (PUE), que muestra cuánta energía se gasta en la operación de carga de TI y cuánto se gasta en necesidades auxiliares, como refrigeración y operación del UPS, y pérdidas. en el sistema de distribución. Se calcula dividiendo el consumo de energía total por el consumo de equipos de TI. Hasta hace poco, el factor PUE de 1,6 a 2,0 se consideraba aceptable. Ahora, sin embargo, el mercado demanda centros de datos más eficientes; por lo tanto, la lucha por valores del 1,1 al 1,2 continúa. La mayoría de las veces, el consumo se mide en la salida del UPS, la salida de la unidad de distribución de energía y el uso real de los equipos de TI.

    En función de los datos obtenidos, se puede determinar la eficiencia energética del centro de datos con bastante precisión. Sin embargo, la PUE no refleja todos los matices asociados con ella. Esto sigue siendo importante, pero no permite, por ejemplo, tener en cuenta el tiempo de inactividad del servidor o identificar puntos de acceso problemáticos. Además, la reducción de PUE a cerca de uno generalmente ocurre en detrimento de la confiabilidad del centro de datos: los accidentes y la vida útil reducida del equipo pueden negar el efecto del ahorro de energía.

    Los sistemas de control modernos recopilan datos de consumo de energía de servidores, gabinetes y equipos de distribución. Incluso se puede controlar cada toma de corriente. Las estadísticas del consumo de recursos críticos se pueden ver de una manera fácil de entender, lo que facilita encontrar las áreas con mayor consumo de energía y optimizar los costos. Los períodos de reducción de carga también se pueden identificar para programar el mantenimiento durante estos períodos. El análisis de consumo máximo le permite mantener la reserva de energía en el rango de 10%-15% en lugar de 30%-40%, como en el caso del control manual. Además, es un ahorro significativo también.

    Las soluciones de clase DCIM también supervisan otros subsistemas de ingeniería. Por ejemplo, ayudan a mapear el flujo de aire para identificar áreas problemáticas de aire acondicionado y control de clima que solo son superadas por los equipos de TI en términos de consumo de electricidad en el centro de datos. Recuerde solucionar el problema antes de que ocurran problemas graves, y prevenga y elimine rápidamente los problemas, lo que aumenta la confiabilidad de la infraestructura y también reduce los costos. El control manual solo es posible en el caso de una pequeña sala de servidores, pero cuando hay docenas o incluso cientos de recintos en la sala de servidores, la introducción de DCIM se convierte en una necesidad.

     

    Resumen de la Industria

    Hasta ahora, solo hemos hablado de la infraestructura de ingeniería, porque administrar la infraestructura de TI se considera una tarea separada. Esto generalmente se hace usando sistemas que no están relacionados con DCIM. Cuando se trata de centros de datos empresariales, el trabajo de los equipos de TI es responsabilidad de los clientes. Sin embargo, el desarrollo de la virtualización y la arquitectura convergente / hiperconvergente está cambiando gradualmente la situación. Hoy, los desarrolladores están desarrollando soluciones que permiten el monitoreo en tiempo real del estado del servidor virtual en dispositivos físicos individuales, y los proveedores de TI están incorporando una gran cantidad de sensores en sus productos para monitorear el consumo de energía y la temperatura.

    La planificación efectiva de la carga en entornos virtuales debe cubrir todos los niveles: sistemas operativos y aplicaciones, servidores, sistemas de almacenamiento, equipos de telecomunicaciones y canales de comunicación y, por supuesto, recursos físicos como energía, refrigeración, humidificación y otros. Las soluciones DCIM ya no son una "cosa en sí mismas" en los grandes centros de datos empresariales. Su estrecha integración con las plataformas de virtualización y los sistemas de gestión de infraestructura de TI es solo un asunto en un futuro cercano.

    top

    QUICK LINKS

    Suscribir Boletín