Nutanix

Prism Central: Dashboard principal y Widgets

Hoy me gustaría hablar de Prism Central, plataforma web de gestión distribuida Multi-Cluster que permite al usuario gestionar, monitorizar objetos y servicios de manera centraliza en un o varios cluster de Nutanix.

Cuando hablamos de monitorizar, no me refiero a un sistema de monitorización como tal, Prism Central no instala ningún agente en máquinas virtuales ni servidores físicos como pudiera hacerlo PRTG, Nagios, etc., pero si nos avisa de anomalías en las máquinas virtuales, fallos de memoria RAM, fuentes de alimentación, tarjetas de red, etc.

Unas de las funcionalidades que mas me gustan de Prism Central PRO es el poder optimizar los recursos físicos debido al consumo innecesario de las máquinas virtuales (Right-Sizing VMs).

Si trabajáis con VMware, sabrás que vCenter Server se apoya en una herramienta adicional al vCenter conocida como VMware vRealize Operations Manager o herramientas de terceros tipo DC Scope (Easyvirt). Todas estas herramientas se ocupan de analizar recursos y anomalías en nuestro entorno virtualizado.

Sin entretenernos mucho más, vamos a ver los principales widgets que uso para poder identificar Overprovisioned, alertas, supervision de recursos como CPU/RAM entre otros.

(1) Impacted Cluster

En Impacted Cluster podemos ver las alertas consideradas como críticas o warning (anomalías) en las últimas 24 horas. Anomalías de tipo memoria usada, uso de CPU, bandwidth, I/O de diferentes tamaños de bloques etc. Para ver estos detalles, basta con que hagas click en las campanillas roja, naranja o bien, sobre el triángulo naranja (138) en mi caso. Así mismo, cada puntito rojo debajo de Impacted Cluster, son diferentes Cluster y por cada cluster, podemos ver anomalías, Runway (explicado en otro artículo hace un tiempo), ineficiencia de recursos en VM y Plays (lo explicaré en otro artículo).

(2) VM Efficiency

En VM Efficiency podemos apreciar la cantidad de recursos Overprovioned, en mi caso, 240 máquinas virtuales. si hacemos click sobre cada cuadro, tendremos un detalle más exhaustivo de los recursos, como por ejemplo:

En la imagen podemos apreciar qué maquina virtual está sobre aprovisionada, ya sea por CPU o memoria RAM. Si una máquina virtual tiene 4 vCPU y la media de uso es del 6.98% como en la primera máquina del cuadro, significa que podríamos dejarla con 2 vCPU o incluso, 1 vCPU y la máquina virtual no tendría problemas de rendimiento.

Overprovisioned observa estos contadores:

  • CPU usage < 20% and CPU ready time < 5%
  • Memory usage < 50% (moderately) or < 20% (severely) and memory swap rate = 0 Kbps

También podemos apreciar las máquinas virtuales «inactives«, consideradas como muertas o zombie.

  • «Dead» VM: Una VM es considerada como «muerta» cuando lleva 30 días apagada.
  • «Zombie» VM: Una máquina virtual se considera zombie cuando se enciende, pero lee o escribe menos de 30 I/O (total) y recibe o transfiere menos de 1000 bytes por día durante los últimos 30 días..

El cuadro Constrained nos indica la máquina virtual limitada por recursos, es decir, si una máquina virtual tiene 2 vCPU y la media o el uso de recursos del 100%, nos indica que deberíamos de subirle el vCPU a la máquina virtual para que no tenga estrés.

Constrained observa estos contadores:

  • CPU usage > 90% (moderate), 95% (high)
  • CPU ready time > 5% , 10%
  • Memory usage > 90%, 95%
  • Memory swap rate > 0 Kbps (no moderate value)

Y por último, el cuadro Bully nos indica qué maquinas virtuales están consumiendo muchos recursos y afectando al resto de máquinas virtuales.

Bully observa estos contadores:

  • CPU ready time > 5% 
  • Memory swap rate > 0 Kbps
  • Host I/O Stargate CPU usage > 85%

(3) Cluster Storage

Este Widget nos indica el espacio utilizado por cada cluster así como el Data Reduction Ratio (sólo si habilitamos deduplicación, compresión o erasure coding). Un widget muy interesante para de un simple vistazo, tener controlado el uso de espacio en cada cluster.

(4) Cluster CPU Usage

Como el widget lo indica, podemos ver el top de clusters que más CPU están demandando, interesante también para ver la carga de un simple vistazo.

(5) Cluster Memory Usage

Este widget indica el top de clusters que más memoria RAM están demandando.

(6) Cluster Latency

Otro widget interesante en el de la latencia de cada cluster, como sabréis, todo cluster con alta latencia, independiente de que sea Nutanix o no, es un indicativo de cuello de botella en el Storage, muchas máquinas virtuales haciendo un alto uso de IOPS.

(7) Cluster IOPS

Por último, con esta gráfica podemos conocer fácilmente los IOPS de lectura y escritura que hay en cada Cluster, el TOP de Cluster con mas IOPS.

Podemos añadir más widgets y ordenarlos como a nosotros nos guste, basta con arrastrar y soltar a la posición que deseemos. Por último y no por eso menos importante, existen widgets por defecto que no son modificables y otros que podemos customizarlo a nuestro gusto y añadir en el Dashboard Principal.

Esto ha sido todo, espero que os sirva de ayuda y gracias por tomarse el tiempo de leer y compartirlo.

Leandro Ariel Leonhardt es experto en Virtualización de Sistemas especializado en Nutanix y VMware. Autor del curso online "Hiperconvergencia con Nutanix: aprende a instalar y configurar" desde cero: https://www.udemy.com/hiperconvergencia-con-nutanix-instalacion-y-configuracion/. Nutanix NCP, NCSC, NCSE 1 & Nutanix Technology Champions (NTC) 2018/2017. Nombrado vExpert PRO y vExpert desde el año 2013, vExpert vSAN 2019/18/17/16 & vExpert Cloud 2017. Ex-VCI, VCAP-DCA, VCP-DCV & VCP-NV. Co-autor del libro https://www.vmwareporvexperts.com | Más información sobre su trayectoria en: https://www.leandroleonhardt.com y https://www.youracclaim.com/users/leandro-ariel-leonhardt/badges

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.