El Health Service es una nueva característica de Windows Server 2016 que mejora la supervisión diaria y la experiencia operacional de los clústeres que ejecutan Storage Spaces Direct. Este servicio está habilitado de forma predeterminada con Storage Spaces Direct. No se requiere ninguna acción adicional para configurarlo o iniciarlo

Disk Lifecycle: El Servicio de Salud automatiza la mayoría de las etapas del ciclo de vida del disco físico. Digamos que el estado inicial de su despliegue está en perfecto estado de salud, es decir, todos los discos físicos están funcionando correctamente.

Retirement: Los discos físicos se retiran automáticamente cuando ya no se pueden utilizar, y se genera una falla correspondiente. Hay varios casos:

  • Fallo de medios: el disco físico está definitivamente fallido o roto, y debe ser reemplazado.
  • Comunicación perdida: el disco físico ha perdido la conectividad por más de 15 minutos consecutivos.
  • No responde: el disco físico ha mostrado latencia de más de 5,0 segundos tres o más veces en una hora.

Si el disco retirado servía como caché para muchos otros discos físicos, éstos se reasignarían automáticamente a otro disco de antememoria si uno estuviera disponible. No se requiere ninguna acción especial del usuario.

Restoring resiliency: Una vez que se ha retirado un disco físico, el Servicio de Salud inmediatamente comienza a copiar sus datos en los discos físicos restantes, para restaurar la total elasticidad. Una vez que esto se ha completado, los datos son completamente seguros y tolerantes a fallos de nuevo.

Blinking the indicator light; Si es posible, el Servicio de Salud comenzará a parpadear el indicador luminoso en el disco físico retirado o su ranura. Esto continuará indefinidamente, hasta que se reemplace el disco retirado.

Physical replacement: Debe reemplazar el disco físico retirado cuando sea posible. La mayoría de las veces, esto consiste en un intercambio en caliente – es decir, el apagado del nodo o el recinto de almacenamiento no es necesario. Consulte la sección "Fault" para obtener información útil sobre la ubicación y las piezas.

Verificacion: Cuando se inserte el disco de reemplazo, se verificará

Pooling: Si se permite, el disco de reemplazo se sustituye automáticamente en el grupo de su predecesor para que se utilice. En este punto, el sistema se devuelve a su estado inicial de perfecta salud, y entonces el fallo desaparece.

cluster002.jpg

El Servicio de Salud proporciona un mecanismo de cumplimiento para restringir los componentes utilizados por Storage Spaces Direct a aquellos en un Documento de Componentes Soportados proporcionado por el administrador o el proveedor de la solución. Esto se puede utilizar para evitar el uso equivocado de hardware no soportado por usted u otros, lo que puede ayudar con la garantía o el cumplimiento del contrato de soporte. Actualmente, esta funcionalidad se limita a dispositivos de disco físicos, incluidos discos SSD, discos duros y unidades NVMe. El documento de componentes compatibles puede restringirse en el modelo, el fabricante (opcional) y la versión de firmware (opcional).

Utilizacion: El Documento de Componentes Soportados utiliza una sintaxis inspirada en XML. Le recomendamos que utilice su editor de texto favorito, como Visual Studio Code o Notepad, para crear un documento XML que puede guardar y volver a utilizar.

cluster001

Si se proporciona la sección Discos, sólo se permite que las unidades enumeradas se unan a las agrupaciones. Se impide que las unidades no listadas se unan a las agrupaciones, lo que impide efectivamente su uso en la producción. Si esta sección se deja vacía, se permitirá a cualquier unidad unirse a las agrupaciones. Si se proporciona la sección de caché, sólo se utilizarán las unidades enumeradas para el almacenamiento en caché. Si esta sección se deja vacía, Storage Spaces Direct intentará adivinar según el tipo de medio y el tipo de bus. Por ejemplo, si su implementación utiliza unidades SSD (Solidstate Drive) y unidades de disco duro (HDD), la primera se selecciona automáticamente para el almacenamiento en caché; sin embargo, si su implementación usa all-flash, es posible que deba especificar los dispositivos de resistencia más altos que desea utilizar para almacenar en caché.

Para los reportes, el Servicio de Salud reduce el trabajo requerido para obtener información de rendimiento y capacidad en directo desde el clúster de Storage Spaces Direct. Un nuevo cmdlet proporciona una lista curada de métricas esenciales, que se recopilan eficientemente y se agregan dinámicamente entre nodos, con lógica incorporada para detectar la pertenencia a un clúster. Todos los valores son en tiempo real y punto-en-tiempo solamente.

En Windows Server 2016, el Health Service nos provee las siguientes metricas:

  • IOPS (Read, Write, Total)
  • IO Throughput (Read, Write, Total)
  • IO Latency (Read, Write)
  • Physical Capacity (Total, Remaining)
  • Pool Capacity (Total, Remaining)
  • Volume Capacity (Total, Remaining)
  • CPU Utilization %, All Machines
  • Average Memory, All Machines (Total, Available)

Espero les sea de interes. Saludos. Roberto Di Lello.

By Roberto Di Lello

Hola, soy Roberto Di Lello trabajo como Consultor Senior en Infraestructura, especializado en Tecnologias Microsoft con mas de 25 años en la industria. He sido galardonado como MS-MVP en Active Directory-Enterprise Mobility por 10 años, y actualmente soy MVP Windows Insider, ademas de poseer otras certificaciones de Microsoft. He trabajado en distintos projectos que involucran Migraciones, Implementaciones, y soporte de Active Directory y Microsoft Exchange, y en los ultimos años me he desempeñado armando equipos de trabajo para diferentes paises y areas de sistemas, he planificado a distintas migraciones a datacenters (ambiente cloud y mixtos). He tenido la oportunidad de participar como miembro del staff de Microsoft en eventos internacionales como ser TechEd NorteAmerica y MS Ignite (NA) al ser Trainer Certificado por Microsoft (MCT).

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.