{"id":3170,"date":"2016-07-13T12:49:00","date_gmt":"2016-07-13T15:49:00","guid":{"rendered":"http:\/\/www.radians.com.ar\/blog\/?p=3170"},"modified":"2016-07-14T12:50:15","modified_gmt":"2016-07-14T15:50:15","slug":"windows-server-2012-r2-extendiendo-data-deduplication-a-nuevos-workloads","status":"publish","type":"post","link":"https:\/\/www.radians.com.ar\/blog\/?p=3170","title":{"rendered":"Windows Server 2012 R2: Extendiendo &ldquo;Data Deduplication&rdquo; a nuevos workloads"},"content":{"rendered":"<p align=\"justify\"><a href=\"http:\/\/www.radians.com.ar\/Articulos\/Images2016\/WindowsServer2012R2ExtendiendoDataDedupl_B463\/DataDedup.jpg\"><img loading=\"lazy\" decoding=\"async\" title=\"www.radians.com.ar\" style=\"border-top: 0px; border-right: 0px; border-bottom: 0px; margin-left: 0px; border-left: 0px; display: inline; margin-right: 0px\" border=\"0\" alt=\"www.radians.com.ar\" src=\"http:\/\/www.radians.com.ar\/Articulos\/Images2016\/WindowsServer2012R2ExtendiendoDataDedupl_B463\/DataDedup_thumb.jpg\" width=\"300\" align=\"left\" height=\"211\" \/><\/a>&#160; En Windows Server 2012 se introdujo el nuevo feature llamado \u201cData Deduplication\u201d que nos permite b\u00e1sicamente realizar la eliminaci\u00f3n de datos duplicados.<\/p>\n<p align=\"justify\">La <b>deduplicaci\u00f3n de datos<\/b> es una t\u00e9cnica especializada de compresi\u00f3n de datos para eliminar copias duplicadas de datos repetidos. Un t\u00e9rmino relacionado con la deduplicaci\u00f3n de datos es la compresi\u00f3n inteligente de datos. Esta t\u00e9cnica se usa para optimizar el almacenamiento de datos en disco y tambi\u00e9n para reducir la cantidad de informaci\u00f3n que debe enviarse de un dispositivo a otro a trav\u00e9s de redes de comunicaci\u00f3n.<\/p>\n<p align=\"justify\">Esta caracter\u00edsticas que se convirti\u00f3 r\u00e1pidamente en una de las cosas normales a considerar al implementar servidores de archivos, ya que nos brinda m\u00e1s espacio en el hardware existente, sin costo alguno; solo debemos tener Windows Server 2012.<\/p>\n<p align=\"justify\">Con esta caracter\u00edstica, hemos visto grandes ahorros de espacio en varios tipos de datos del mundo real en reposo. Algunos de los tipos m\u00e1s comunes de datos incluyen:<\/p>\n<p><a href=\"http:\/\/www.radians.com.ar\/Articulos\/Images2016\/WindowsServer2012R2ExtendiendoDataDedupl_B463\/001.png\"><img loading=\"lazy\" decoding=\"async\" title=\"www.radians.com.ar\" style=\"border-top: 0px; border-right: 0px; border-bottom: 0px; float: none; margin-left: auto; border-left: 0px; display: block; margin-right: auto\" border=\"0\" alt=\"www.radians.com.ar\" src=\"http:\/\/www.radians.com.ar\/Articulos\/Images2016\/WindowsServer2012R2ExtendiendoDataDedupl_B463\/001_thumb.png\" width=\"540\" height=\"178\" \/><\/a> <\/p>\n<p align=\"justify\">Estas cifras se basan en la medici\u00f3n de las tasas de ahorro en diversas implementaciones de los clientes de eliminaci\u00f3n de datos duplicados en Windows Server 2012. Sin embargo, hemos visto algunas tendencias interesantes:<\/p>\n<ul>\n<li>\n<div align=\"justify\">Los clientes estaban ajustando las pol\u00edticas predeterminadas para los archivos que desean optimizar para incluir m\u00e1s datos. Por defecto, la deduplicaci\u00f3n de datos s\u00f3lo optimiza los archivos que no han sido modificados en 5 d\u00edas. Los clientes estaban preparando para optimizar los archivos mayores de 3 d\u00edas y en muchos casos para optimizar todos los archivos independientemente de su edad. <\/div>\n<\/li>\n<li>\n<div align=\"justify\">Los clientes estaban tratando de optimizar sus bibliotecas VHD&#8230; que por supuesto no terminaba funcionando correctamente<\/div>\n<\/li>\n<\/ul>\n<p align=\"justify\">En ambos casos vemos que la gente trata de poner m\u00e1s datos dentro de la deduplicaci\u00f3n de datos y para un mejor aprovechamiento de los enormes ahorros se ven en las bibliotecas est\u00e1ticas VHD. Sin embargo, la deduplicaci\u00f3n de datos en Windows Server 2012 no estaba dise\u00f1ada para hacer frente a los datos que cambian con frecuencia o incluso est\u00e1 en uso activo.<\/p>\n<h2>El camino a nuevas cargas de trabajo para la Eliminaci\u00f3n de datos duplicados<\/h2>\n<p align=\"justify\">Segun el feedback de los clientes que se nos ofrec\u00eda mostr\u00f3 una clara necesidad de reducir los gastos de almacenamiento en nubes privadas; para una visi\u00f3n general de todas las dem\u00e1s cosas nuevas alrededor de almacenamiento) y, espec\u00edficamente, para extender la deduplicaci\u00f3n de datos para las nuevas cargas de trabajo.<\/p>\n<p align=\"justify\">Espec\u00edficamente ten\u00edamos que empezar a soportar el almacenamiento de los discos duros virtuales en vivo para algunos escenarios.<\/p>\n<p align=\"justify\">Resulta que hab\u00eda algunos cambios clave que hab\u00eda que hacer para siquiera considerar el uso de la deduplicaci\u00f3n de datos para archivos abiertos:<\/p>\n<ul>\n<li>\n<div align=\"justify\">El rendimiento de lectura era bastante bueno ya, pero el rendimiento de escritura necesita ser mejorado.<\/div>\n<\/li>\n<li>\n<div align=\"justify\">La velocidad a la que la deduplicaci\u00f3n de datos optimiza los archivos necesarios para ser m\u00e1s r\u00e1pido para mantenerse al d\u00eda con los cambios (churn) en archivos.<\/div>\n<\/li>\n<li>\n<div align=\"justify\">Se ha tenido que permitir que los archivos abiertos para optimizar mediante la deduplicaci\u00f3n de datos (si bien de forma activa estaba siendo modificado)<\/div>\n<\/li>\n<\/ul>\n<p align=\"justify\">Tambi\u00e9n, que todas estas modificaciones ten\u00edan un impacto directo sobre los recursos del servidor que ejecuta la deduplicaci\u00f3n de datos. Si vamos a ejecutar esto en el mismo servidor que las m\u00e1quinas virtuales, el HOST, entonces estar\u00edamos compitiendo con ellos por los recursos. Especialmente la memoria. As\u00ed que r\u00e1pidamente se lleg\u00f3 a la conclusi\u00f3n de que era necesario separar los nodos de almacenamiento y de c\u00e1lculo cuando la deduplicaci\u00f3n de datos esta involucrada con la virtualizaci\u00f3n. Por supuesto esto significo que se realizara un an\u00e1lisis de los shares y que se soportaran vol\u00famenes CSV para la eliminaci\u00f3n de datos duplicados.<\/p>\n<p align=\"justify\">Sin embargo, sabemos que la deduplicaci\u00f3n de datos tiene que incurrir en algunos gastos. As\u00ed que se necesitaba objetivos reales. Resulta que decidiendo que son lo suficientemente r\u00e1pidos como para todos los escenarios de virtualizaci\u00f3n es muy dif\u00edcil. As\u00ed que se decidi\u00f3 dar un primer paso con una carga de trabajo de virtualizaci\u00f3n que se entiende bien:<\/p>\n<p><strong>La deduplicaci\u00f3n de datos en Windows Server 2012 R2 soporta la optimizaci\u00f3n de almacenamiento para infraestructura en implementaciones de escritorio virtual (VDI), siempre y cuando los nodos de almacenamiento y c\u00f3mputo se conectan de forma remota.<\/strong><\/p>\n<h2>\u00bfQu\u00e9 hay de nuevo en la eliminaci\u00f3n de datos duplicados en Windows Server 2012 R2<\/h2>\n<p>Con Windows Server 2012 R2, la deduplicaci\u00f3n de datos se extiende al almacenamiento remoto de la carga de trabajo VDI:<\/p>\n<p align=\"justify\"><a href=\"http:\/\/www.radians.com.ar\/Articulos\/Images2016\/WindowsServer2012R2ExtendiendoDataDedupl_B463\/002.png\"><img loading=\"lazy\" decoding=\"async\" title=\"www.radians.com.ar\" style=\"border-top: 0px; border-right: 0px; border-bottom: 0px; float: none; margin-left: auto; border-left: 0px; display: block; margin-right: auto\" border=\"0\" alt=\"www.radians.com.ar\" src=\"http:\/\/www.radians.com.ar\/Articulos\/Images2016\/WindowsServer2012R2ExtendiendoDataDedupl_B463\/002_thumb.png\" width=\"540\" height=\"306\" \/><\/a><\/p>\n<h2>Esta Hyper-V soportada con un volumen deduplicados?<\/h2>\n<p align=\"justify\">Se ha invertido un mont\u00f3n de tiempo para asegurar que la deduplicaci\u00f3n de datos funcione correctamente en las cargas de trabajo generales de virtualizaci\u00f3n. Sin embargo, nos se han centrado los esfuerzos para asegurar que el rendimiento de los archivos optimizados es adecuado para escenarios de VDI. Para los escenarios no VDI (VMs Hyper-V en general), no se ofrecen las mismas garant\u00edas de rendimiento.<\/p>\n<p align=\"justify\">Como resultado, no se soporta la deduplicaci\u00f3n arbitraria en el uso de discos duros virtuales VHDs en Windows Server 2012 R2. Sin embargo, dado que la deduplicaci\u00f3n de datos es una parte fundamental de la pila de almacenamiento, no hay ning\u00fan bloque expl\u00edcita en el lugar que le impide ser habilitado en las cargas de trabajo arbitrarios.<\/p>\n<h2>\u00bfQu\u00e9 beneficios que obtenemos de deduplicaci\u00f3n de datos utilizando la norma VDI?<\/h2>\n<p align=\"justify\">Vamos a empezar con la m\u00e1s f\u00e1cil: ahorraremos espacio! Y, por supuesto, el ahorro de espacio se traduce en ahorro de dinero. Las tasas de eliminaci\u00f3n de datos duplicados para los despliegues en VDI pueden ir tan alto como 95% de ahorro. Esto permite que las implementaciones de vol\u00famenes basados \u200b\u200ben SSD para VDI, aprovechen todas las caracter\u00edsticas mejoradas IO al tiempo que mitiga su baja capacidad. Esto tambi\u00e9n permite la simplificaci\u00f3n de la infraestructura que rodea tales como JBOD, refrigeraci\u00f3n, electricidad, etc.<\/p>\n<p align=\"justify\">Por otra parte, debido al hecho de que Eliminaci\u00f3n de datos duplicados consolida los archivos, los mecanismos de almacenamiento en cach\u00e9 m\u00e1s eficientes son posibles. Esto da como resultado en la mejora de las caracter\u00edsticas IO del subsistema de almacenamiento para algunos tipos de operaciones. As\u00ed que no s\u00f3lo la deduplicaci\u00f3n a ahorrar dinero, puede hacer que las cosas van m\u00e1s r\u00e1pido. Como resultado de estos, a menudo podemos estirar la capacidad de VM del subsistema de almacenamiento sin necesidad de comprar hardware o infraestructura adicional.<\/p>\n<h2>Wrap-up<\/h2>\n<p align=\"justify\">La deduplicaci\u00f3n de datos en Windows Server 2012 R2 permite la optimizaci\u00f3n de los discos duros virtuales en vivo para las cargas de trabajo VDI y permite vol\u00famenes CSV deduplicados. Tambi\u00e9n mejora significativamente el rendimiento de la optimizaci\u00f3n, as\u00ed como IO en archivos optimizados. Esto permitir\u00e1 una mejor utilizaci\u00f3n de los subsistemas de almacenamiento existentes para servidores de archivos generales, as\u00ed como para el almacenamiento de VDI y simplificar las futuras inversiones en infraestructuras.<\/p>\n<p>Espero que les sea de interes. Saludos. Roberto Di Lello.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>&#160; En Windows Server 2012 se introdujo el nuevo feature llamado \u201cData Deduplication\u201d que nos&#8230;<\/p>\n","protected":false},"author":1,"featured_media":4291,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"footnotes":""},"categories":[158],"tags":[197,243],"class_list":["post-3170","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-windows-server-2012","tag-file-server","tag-windows-server-2012-r2"],"_links":{"self":[{"href":"https:\/\/www.radians.com.ar\/blog\/index.php?rest_route=\/wp\/v2\/posts\/3170","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.radians.com.ar\/blog\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.radians.com.ar\/blog\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.radians.com.ar\/blog\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.radians.com.ar\/blog\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=3170"}],"version-history":[{"count":1,"href":"https:\/\/www.radians.com.ar\/blog\/index.php?rest_route=\/wp\/v2\/posts\/3170\/revisions"}],"predecessor-version":[{"id":3171,"href":"https:\/\/www.radians.com.ar\/blog\/index.php?rest_route=\/wp\/v2\/posts\/3170\/revisions\/3171"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.radians.com.ar\/blog\/index.php?rest_route=\/wp\/v2\/media\/4291"}],"wp:attachment":[{"href":"https:\/\/www.radians.com.ar\/blog\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=3170"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.radians.com.ar\/blog\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=3170"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.radians.com.ar\/blog\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=3170"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}