Icono del sitio Aprender BIG DATA

¿Qué es Apache Myriad? Una breve introducción

En esta entrada, voy a realizar una breve introducción a Apache Myriad. Como committer de este proyecto Apache, me gustaría compartir esta herramienta y sus posibilidades.

Apache Myriad es un proyecto open source que nació en el año 2015 con el propósito de compartir una misma infraestructura para ejecutar cargas de Apache Mesos y de Apache Hadoop.

De esta forma, Apache Myriad pretende ejecutar uno o varios clusters de Apache Hadoop YARN (el planificador y gestor de recursos de Hadoop) sobre un clúster de Apache Mesos. Con esta solución, es posible compartir los recursos gestionados por Mesos de una forma dinámica, tener varios clusters independientes de Yarn y con capacidad de crecer o decrecer basándose en la demanda existente.

El proyecto se encuentra en este momento en la incubadora de la Apache Software Foundation, una fase previa que cada proyecto debe superar para convertirse en un proyecto con plena entidad dentro de la fundación o Top Level Project.

Aspectos clave de Apache Myriad

En el roadmap de Apache Myriad se encuentra las siguientes funcionalidades:

Los componentes de Apache Myriad, al igual que comenté en la guía de iniciación a frameworks para Apache Mesos consisten en un Driver, un Scheduler y uno o varios Executors. En este caso, el Driver se encarga de levantar la interfaz de usuario, la API y otros servicios necesarios para Myriad. El Scheduler es el encargado de gestionar las ofertas de recursos y lanzar las tareas necesarias sobre los contenedores en los agentes de Mesos.

En esencia, Apache Myriad sólamente debe gestionar dos tipos de ejecutores, que coinciden con los componentes de Yarn: Resource Manager y Node Manager. Para cada clúster de Yarn es necesario un Resource Manager activo y al menos un Node Manager sobre el que planificar trabajos y ejecutar cargas Big Data.

Diagrama de nodo ejecutando un node manager de YARN como una tarea en un agente de Mesos

Al estar ejecutando sobre recursos dinámicos, Myriad debe gestionar el estado de los componentes de Yarn y ofrecer una visión unificada para que el usuario pueda agregar recursos al planificador (a través del despliegue de más Node Managers) o bien reducir estos recursos.

Apache Myriad es ideal para desplegar entornos Yarn fácilmente y tras operar en ellos, liberar los recursos sin complicación.

En artículos posteriores desarrollaré con más profundidad esta tecnología, así como su despliegue y su configuración.


A continuación el vídeo-resumen. ¡No te lo pierdas!


Salir de la versión móvil