Nutanix

El Data Tiering en Nutanix

Nutanix Distributed File System (el alma de un cluster Nutanix) controlan los patrones de accesos y monitorizan los diferentes datos de acceso al sistema distribuido para optimizar el rendimiento de cada máquina virtual que reside en Nutanix.

Los datos de acceso frecuente (es decir, los denominados como “datos caliente”) y las operaciones de E/S aleatorias se mantienen en el almacenamiento más rápido, memoria de alta velocidad o SSD basada en flash.

Los datos con acceso menos frecuente (es decir, “frío”) y las operaciones E/S secuenciales se mueven a un disco duro de mayor capacidad (magnéticos para entornos híbridos), manteniendo los datos totalmente redundantes y protegidos contra fallas.

Los datos aleatorios se escriben en un área dedicada del SSD denominado Oplog (un servicio de la controladora CVM). El Oplog es un caché de escritura basado en SSD construido para manejar operaciones de E/S. Oplog almacena los datos de manera persistente y sincronizado con todos los Oplog de otros CVM, el éxito de Nutanix en ofrecer baja latencia y alto rendimiento a las máquinas virtuales se basa en esta tecnología de caché integrada en las “controladores” denominadas CVM (Controller Virtual Machine).

Después de que los datos se hayan almacenado en dos nodos diferentes en el Cluster Nutanix (para dotar de alta disponibilidad), la máquina virtual huésped recibe un ACK de que el dato se escribió y redundo correctamente.

El resultado es que cualquier escritura reconocida con un ACK a la VM huésped es garantía que se ha persistido en el disco y, por lo tanto, se puede recuperar posteriormente, incluso si hay un fallo de suministro de energía, SSD o fallo del nodo milisegundos después de que la escritura haya sido confirmada.
Una vez que se han conservado los datos en el Oplog y se ha reconocido a la máquina virtual invitada, se fusiona y se drena secuencialmente en el Extent Store. El almacén de extensión se compone de extensiones, que son regiones contiguas de tamaño variable de un vDisk (un archivo NDFS) que abarca los niveles SSD y HDD.

El Oplog se drena continuamente para mantener espacio para escrituras entrantes posteriores y para mantener el nivel más alto de rendimiento.

Las escrituras secuenciales, sin embargo, saltan completamente el Oplog y van directamente al Extent Store. Esto se debe a que los datos secuenciales son continuos y pueden escribirse eficientemente bloques grandes en disco sin impacto en el rendimiento. Además, se requieren menos actualizaciones de metadatos para cada byte de datos secuenciales que se escriben, por lo que se gasta menos tiempo realizando actualizaciones de metadatos.

La escritura de datos secuenciales directamente en HDD también reduce la cantidad total de datos almacenados en el nivel SSD, preservando la capacidad SSD para datos aleatorios y extendiendo la vida útil del almacenamiento SSD basado en flash.

Los datos en el Extent Store permanecerán en el nivel de rendimiento más alto siempre y cuando se accedan con frecuecia. Sin embargo, si los patrones de acceso a los datos disminuyen, se marcará para la migración al nivel de almacenamiento “frío” de alta capacidad (HDD).

La evaluación de los datos denominados como “fríos” se realizada por un componente del sistema llamado Curador, Curator es el “orquestador” de los datos encargado de realizar las tareas de fondo (transparente) para mantener el Cluster funcionando sin problemas.

Cada CVM tiene una caché de lectura en memoria llamada Extent cache (content cache). Los datos que requieren mucho acceso se colocan en esta memoria caché de lectura local para permitir que las solicitudes se sirvan directamente desde la memoria, lo que genera recuperaciones de latencia muy baja.

Curator aprovecha una serie de algoritmos de reducción de mapa para escanear eficientemente los metadatos
de manera distribuida analizando diferentes porciones de metadatos en cada nodo del clúster.

Gestiona muchas operaciones del sistema de archivos, incluyendo niveles de datos, reequilibrio de disco, desfragmentación, reparación de redundancia de datos después de un fallo de disco o nodo, y mucho más.

Curator se ejecuta una vez por hora y cada vez que ocurre un evento crítico. Ejemplos de eventos críticos incluyen fallas de disco o nodos, el nivel de SSD se llena más allá de un umbral determinado/disco (HDD o SSD) se llena más allá de un umbral determinado en relación a otros discos.

A la inversa, los datos también pueden promocionarse desde el nivel HDD hasta el nivel SSD de alta velocidad
cuando aumenta la frecuencia de acceso a los datos. Los datos se promueven al nivel SSD si se accede tres veces en 20 minutos y si hay entre 10 segundos y 10 minutos que separan las tres peticiones de lectura.

Esto permite que los datos se migren al nivel SSD sin promover innecesariamente los datos que se accede simplemente por períodos de tiempo muy breves.

Todos los discos de un nivel determinado (tier) son gestionados por la CVM local para las operaciones de E/S. Ésta utiliza todo el ancho de banda disponible para todos los discos, tanto para lecturas como para escrituras.

También proporciona un rendimiento de nivel “RAID-0 like”, pero sin el riesgo de que un nodo entero se vuelva inasequible si ocurre un fallo de disco único. Del mismo modo, todas las CVM del clúster participan en la replicación del Oplog y Extent Store.

Esto ha sido todo por esta semana, espero que te haya parecido de interés, recuerda que si os gusta y apasiona la hiperconvergencia y el sddc, tenéis a vuestra disposición en Udemy el Curso online de Nutanix: Aprende a instalar y configurar desde cero al 50% de descuento hasta 31 de Marzo de 2017 con el cupón: PROMO-INICIAL2

Gracias por leer y compartir.

¡Se sociable!Tweet about this on Twitter17Share on LinkedIn33Share on Google+2Share on Facebook0Share on Reddit1Share on Tumblr1Buffer this pageEmail this to someonePrint this page

Leandro Ariel Leonhardt es especialista en Virtualización de Sistemas y Cloud Computing. Autor del curso online "Hiperconvergencia con Nutanix: aprende a instalar y configurar" desde cero: https://www.udemy.com/hiperconvergencia-con-nutanix-instalacion-y-configuracion/. Nutanix NPP 4.5 & 5.0/NSES/NSEN & Nutanix Technology Champions (NTC) 2017. Nombrado vExpert por VMware desde el año 2013 & vSAN vExpert 2016. VCI, VCAP & VCP5/6. Experto en almacenamiento definido por software (SDS) y sistemas de tipo hiperconvergente (HCI). Más información sobre su trayectoria en: http://www.leandroleonhardt.com

Leave a Comment

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *