Ho vamos a hablar acerca de Windows Server 2016 y los inconvenientes o limitaciones que podemos tener en cuanto a las maquinas virtuales desde el punto de vista del storage. Básicamente sobre Storage Resiliency (Resistencia de almacenamiento de máquina virtual), realmente es medio complicado traducir el nombre. También pueden encontrar mucha información al respecto dentro del sitio de Microsoft, por ejemplo en : Virtual Machine Storage Resiliency in Windows Server 2016.

Vivimos en un mundo imperfecto, donde las cosas van mal. Cuando lo hacen, se necesita una nube privada que está diseñado para ser altamente disponible y resistente a los fallos en el medio ambiente.  En los entornos de nube escala de hoy fallos transitorios de almacenamiento han llegado a ser más común que los fallos de disco duro. Un fallo en el almacenamiento transitorio significa que una máquina virtual (VM) no tiene acceso al archivo VHDX y que las peticiones de lectura o escritura en el disco están fallando. En Windows Server 2016 hay nuevas features de Hyper-V que permiten que una máquina virtual puede detectar cuando el acceso de almacenamiento falla y permitir que sea recuperable. En resumen, moviendo su nube privada a Windows Server 2016 nuestras máquinas virtuales facilitará llegar a nuestro SLA!

¿Qué pasa cuando VM le falla el almacenamiento transitorio?

Que pasaba en Windows Server 2012 R2?, El comportamiento en las versiones anteriores es que cuando una máquina virtual (VM) experimenta un fallo de lectura o escritura en su disco duro virtual (VHD/X), ya sea que la máquina virtual o aplicaciones que se ejecutan dentro de la máquina virtual se estrellaría. Obviamente, esto es muy perjudicial para la carga de trabajo y podria traer consecuencias graves al momento de recuperar el ambiente.

Que pasa en Windows Server 2016?, En Windows Server 2016 nuevas características han permitido que se detecten los errores de almacenamiento y tomen medidas para mitigar el impacto. Cuando una máquina virtual experimenta un fallo en la lectura o escritura en el VHD / VHDX, la máquina virtual se coloca en un estado de pausa crítico. La máquina virtual está congelada en el tiempo, lo que resulta en todo el interior de la máquina virtual y la no generación de I/Os, con lo cual no incrementamos el problema. La VM permanecerá en este estado hasta que el storage este disponible y responda correctamente de nuevo. La máquina virtual volverá de nuevo a un estado de ejecución cuando se puede empezar a leer y escribir a su VHD/X. Dado que se mantiene el estado de la sesión de la máquina virtual, esto significa que la máquina virtual se reanuda exactamente donde lo dejó. Para fallos transitorios cortos, esto será completamente transparente para los clientes.

Recordemos que cuando una máquina virtual está en un estado de pausa crítico, la máquina virtual se congela y no se encuentra accesible a los clientes, entonces habrá una ventana en la que los clientes no serán capaces de acceder a la máquina virtual. Pero el hecho de que el estado de la sesión VM es retenido, hace que el corte de almacenamiento tenga mucho menos impactó. Una máquina virtual no se queda en un estado crítico de pausa indefinidamente, si el acceso de almacenamiento no puede ser recuperado dentro del tiempo de espera configurable, la máquina virtual es entonces se apaga y el siguiente arranque será un arranque en frío.

www.radians.com.ar

Opciones de configuración

Esta nueva funcionalidad es una parte integrada de Hyper-V y no necesitamos hacer nada para utilizarla. Podemos configurar las opciones de “virtual machine storage resiliency” que define el comportamiento de las máquinas virtuales durante fallos transitorios de almacenamiento:

  • Enable/Disable Si deseamos volver al comportamiento de las versiones anteriores, las mejoras de resistencia de almacenamiento se pueden desactivar por VM. Está activado por defecto.
    Para activarlo con PowerShell:
    Set-VM -AutomaticCriticalErrorAction <None | Pause>
  • Timeout – La cantidad de tiempo que una máquina virtual permanece en estado de pausa crítico antes de apagar se puede configurar por VM. El valor predeterminado es de 30 minutos.
    Para activarlo con PowerShell:
    Set-VM –AutomaticCriticalErrorActionTimeout <value in minutes>

VHDX Compartido

VHDX compartidos se utilizan por lo general el que múltiples máquinas virtuales están compartiendo un espacio de almacenamiento y formar un grupo de clientes para proporcionar alta disponibilidad para aplicaciones que se ejecutan dentro de la máquina virtual.

Para un clúster de huéspedes hay capacidad de recuperación en la capa de aplicación en el interior de la máquina virtual, por lo que el comportamiento preferido es tener ocurrir a otra máquina virtual de conmutación por error. La nueva característica de resistencia de almacenamiento es consciente y optimizado para proporcionar el mejor comportamiento para un VHDX compartido. Cuando una máquina virtual experimenta un error en la lectura y la escritura en su VHDX compartido de la conexión de la VHDX compartido es retirado de la máquina virtual.

Esto da lugar a la agrupación dentro de la máquina virtual para detectar el fallo de almacenamiento y tomar las medidas de recuperación. A diferencia de una máquina virtual normal, una máquina virtual con un VHDX compartido no entra en estado de pausa crítica y el cúmulo de invitados mueve su carga de trabajo a otra máquina virtual que también es parte del clúster y tiene acceso a VHDX compartida. La máquina virtual que ha perdido la conexión a su VHDX compartido sondeará cada 10 minutos para comprobar si el acceso de almacenamiento se ha restaurado. Tan pronto como se pone el acceso a la misma, la VHDX compartida se vuelve a unir a la máquina virtual.

www.radians.com.ar

¿Cuándo puedo utilizar resistencia de almacenamiento?

VM storage resiliency es compatible con:

  • Gen1 and Gen2 VMs
  • VHD, VHDX and Shared VHDX
  • Local block storage (SAN)
    • FC, iSCSI, FCoE, SAS with Cluster Shared Volumes
  • File Based storage (NAS)
    • File shares using SMB (Server Message Block protocol) with Continuous availability such as a Scale-out File Server (SoFS)

Storage Resiliency no es compatible con:

  • VHD / VHDX on a local hard disk without Cluster Shared Volumes
  • Standard file servers
  • USB storage
  • Hyper-V pass-through disks

En resumen, Windows Server 2016 se encargará de errores de almacenamiento fallos transitorios. Espero que les sea de interés y utilidad. Saludos. Roberto Di Lello

Avatar photo

By Roberto Di Lello

Hola, soy Roberto Di Lello trabajo como Consultor Senior en Infraestructura, especializado en Tecnologias Microsoft con mas de 25 años en la industria. He sido galardonado como MS-MVP en Active Directory-Enterprise Mobility por 10 años, y actualmente soy MVP Windows Insider, ademas de poseer otras certificaciones de Microsoft. He trabajado en distintos projectos que involucran Migraciones, Implementaciones, y soporte de Active Directory y Microsoft Exchange, y en los ultimos años me he desempeñado armando equipos de trabajo para diferentes paises y areas de sistemas, he planificado a distintas migraciones a datacenters (ambiente cloud y mixtos). He tenido la oportunidad de participar como miembro del staff de Microsoft en eventos internacionales como ser TechEd NorteAmerica y MS Ignite (NA) al ser Trainer Certificado por Microsoft (MCT).

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

This site uses Akismet to reduce spam. Learn how your comment data is processed.