En ocasiones, algunos suscriptores me preguntan por Cloudera, cómo formarse, preparar la certificación y cómo aprender CDP de forma eficiente, ya sea en la modalidad de public o private cloud.
Contenidos
Cómo formarse y certificarse en Cloudera
Lo primero, es que es genial que inviertas tiempo en aprender Cloudera CDP (Cloudera Data Platform), ya que es una herramienta muy potente y utilizada en el ecosistema de Big Data.
Para complementar la formación disponible en Cloudera Education y el training que se ofrece en forma de webinars, te recomendaría lo siguiente:
- Intenta desarrollar un proyecto propio que integre componentes clave como Cloudera Data Engineering, Cloudera Data Warehouse, y Cloudera Machine Learning.
- Enfócate en resolver casos prácticos como ingestión de datos masivos, gestión de lagos de datos y análisis en tiempo real.
En este artículo, te dejo una serie de recursos y formación recomendada para que puedas prepararte a tu ritmo a trabajar con Cloudera y si lo deseas, certificarte.
Certificaciones en Cloudera
Cloudera ofrece un portafolio de certificaciones diseñadas para validar habilidades específicas dentro de su ecosistema. Estas certificaciones están orientadas tanto a desarrolladores como a administradores y analistas, y son reconocidas globalmente por empleadores que buscan expertos en Big Data.
1. Cloudera Certified Associate (CCA)
La certificación CCA está diseñada para profesionales que buscan validar competencias fundamentales en áreas específicas del ecosistema Cloudera:
- CCA Data Analyst (CCA159): Certifica habilidades para trabajar con SQL en Apache Hive e Impala para realizar consultas, análisis y gestión de datos en plataformas Big Data.
- CCA Spark and Hadoop Developer (CCA175): Enfocada en el desarrollo con Apache Spark y Hadoop. Evalúa la capacidad de procesar datos utilizando Spark, PySpark, Scala y Hive.
2. Cloudera Certified Professional (CCP)
Esta certificación es el siguiente nivel después del CCA y se enfoca en demostrar competencias avanzadas en diseño y desarrollo de soluciones Big Data:
CCP Data Engineer: Valida habilidades avanzadas para diseñar, construir y mantener sistemas de datos escalables en un entorno de producción.
3. Certificaciones Cloudera Data Platform (CDP)
Con el lanzamiento de Cloudera Data Platform (CDP), Cloudera ha desarrollado certificaciones que reflejan competencias relacionadas con esta plataforma integral:
- CDP Generalist: Esta certificación es ideal para aquellos que buscan demostrar un entendimiento general de las capacidades de CDP en entornos públicos y privados.
- CDP Administrator: Diseñada para administradores responsables de gestionar clusters CDP, configuraciones de seguridad, y optimización del rendimiento en un entorno híbrido o en la nube.
- CDP Data Developer: Certifica habilidades para desarrollar aplicaciones y flujos de trabajo en Cloudera Data Engineering y herramientas asociadas como Apache NiFi y Apache Kafka.
- CDP Machine Learning: Enfocada en la creación y despliegue de modelos de machine learning utilizando Cloudera Machine Learning (CML).
Libros y Recursos Específicos sobre Cloudera:
- «Hadoop Application Architectures» por Mark Grover, Ted Malaska, Jonathan Seidman y Gwen Shapira:
- Aunque no está específicamente centrado en CDP, ofrece una base sólida sobre arquitecturas Big Data, incluyendo conceptos que aplican a Cloudera.
- Es útil para entender cómo diseñar sistemas escalables y eficientes sobre Hadoop, que es el core de CDP Private Cloud.
- «The Cloudera Enterprise Data Hub Reference Architecture» (Whitepaper):
- Este es un documento oficial de Cloudera que profundiza en las mejores prácticas para implementar Cloudera en diferentes entornos. Aunque es más técnico, te será útil si ya estás familiarizado con los conceptos básicos.
- Puedes buscarlo directamente en los recursos de Cloudera para partners o en su sitio web oficial.
- «Data Warehousing in the Age of Big Data» por Krish Krishnan:
- Este libro aborda cómo implementar y gestionar data warehouses en entornos Big Data, incluyendo herramientas como Impala y Hive, esenciales en Cloudera.
Cursos específicos de Cloudera
- Curso de Especialización en Big Data de Cloudera
- Esta especialización de Coursera ofrecida directamente por Cloudera es muy completa y se compone de cuatro módulos de aprendizaje para dominar la plataforma de análisis de datos y si estás interesado, también preparar la certificación.
- Administración de Hadoop en Cloudera:
- Aprenderás a habilitar la seguridad en Hadoop usando Kerberos y Sentry en la distribución Cloudera. Se preparará un clúster desde cero y se securizará para que aprendas a usarlo.
- Este curso resulta muy útil para administradores de Hadoop y de Cloudera. Enseña a integrar los componentes del clúster con herramientas de seguridad como Active Directory o Sentry y a configurar ACLs, cifrado y auditoría de datos.
- Guía práctica de instalación de un clúster Cloudera CDH con Hadoop y Spark (CCA 131)
- Curso práctico de Udemy que te permitirá introducirte a administrador de Cloudera con multitud de material de aprendizaje sobre el ecosistema Hadoop, Spark y su arquitectura.
Otros Recursos
- Documentación Oficial de Cloudera CDP:
- Aunque no es un «libro» como tal, la documentación oficial es una mina de oro para profundizar en CDP. Si quieres ir más allá, enfócate en las secciones avanzadas sobre:
- Cloudera Manager
- Workload Management
- Data Lake y Data Hub
- Aunque no es un «libro» como tal, la documentación oficial es una mina de oro para profundizar en CDP. Si quieres ir más allá, enfócate en las secciones avanzadas sobre:
- Comunidades de Big Data:
- Grupos como los de LinkedIn, Reddit (subreddit r/bigdata o r/dataengineering), y foros de Cloudera tienen hilos donde profesionales comparten experiencias y recursos. Muchas veces, estos insights prácticos complementan el aprendizaje formal.
Preguntas Frecuentes
¿Cuánto tiempo se necesita para prepararse para una certificación de Cloudera?
Aunque el tiempo de preparación varía según tu nivel de experiencia previa, los principiantes pueden tardar entre 3 y 6 meses de estudio constante. Profesionales con experiencia en Big Data pueden necesitar mucho menos tiempo, especialmente si ya están familiarizados con herramientas como Hadoop, Spark o Hive.
¿Qué certificación debo elegir si soy principiante?
La certificación CCA Spark and Hadoop Developer (CCA175) es una buena opción para empezar, ya que cubre fundamentos clave del ecosistema Cloudera y habilidades esenciales como el desarrollo con Spark. Si estás enfocado en SQL y análisis de datos, CCA Data Analyst (CCA159) es otra buena alternativa.
¿Qué pasa si no apruebo el examen de certificación?
Si no apruebas, Cloudera permite repetir el examen después de un período de espera. Recuerda revisar los objetivos del examen y reforzar tus conocimientos antes de volver a intentarlo.
¿Cuál es el coste de las certificaciones de Cloudera?
El coste varía según la certificación, pero generalmente oscila entre $300 y $400 USD por examen.
Artículos Relacionados