Los ingenieros de datos o data engineer son profesionales con una alta demanda en la actualidad y es probable que te estés preguntando cómo conseguir un trabajo como ingeniero de datos hoy en día. Sigue leyendo.
Contenidos
Ingeniero de Datos – Cómo puedo empezar
Lo primero que debes tener claro es en lo que consiste la profesión de ingeniero de datos. Puedes leer antes este artículo donde resumo lo más importante que necesitas saber sobre los ingenieros de datos, en qué consiste su trabajo y las habilidades que necesitan.
Paso 0 – Establecer Objetivos
Antes de empezar, debes pensar sobre tus objetivos personales y profesionales. Para esto, dedica tiempo a pensar sobre qué quieres hacer o conseguir, qué tipo de empresa te parece interesante para trabajar y cómo y dónde te ves en unos cuantos años, por ejemplo 5 o 10.
Con estas preguntas claras, podrás investigar ofertas de trabajo en múltiples plataformas online. Anota las tecnologías y cualificaciones profesionales más demandadas y selecciona las más importantes para desarrollar tu perfil profesional inicial.
Paso 1 – Habilidades Básicas
No existe un camino único para llegar a ser un ingeniero de datos, La mayoría, van adquiriendo conocimientos y experiencia a través de formación, proyectos, auto aprendizaje y cursos. Si estás interesado en conocer qué cursos online y másteres existen, echa un ojo los cursos online recomendados para empezar como ingeniero de datos y a mi artículo de formación en Big Data para explorar las opciones.
Al tratarse de una profesión muy especializada típicamente se accede desde formaciones de grados en ingeniería, informática o matemáticas. Sin embargo, en el mundo laboral no son completamente necesarios si demuestras buen conocimiento y experiencia. Asegúrate de que conoces los conceptos básicos que he mencionado en el apartado anterior.
Desde un punto de vista práctico, el primer paso debe ser familiarizarse en la terminología y las tecnologías fundamentales necesarias. Un buen punto de partida puede ser descargar el sandbox de Cloudera. Después, leer los tutoriales en los que se explica su instalación, sus componentes y su manejo básico. Esta distribución de Hadoop es muy completa y gratuita, y servirá como toma de contacto con muchas tecnologías. Aun así, no hace falta que intentes aprender todo a la vez.
Paso 2 – Formación
Puedes investigar y ejecutar con los datasets de ejemplo usando Hive, Pig u otras tecnologías de Cloudera para implementar algunas aplicaciones de prueba. Intenta mover los datos entre diferentes sistemas: hacia HDFS y desde HDFS, escribir y leer con HBase y usando Sqoop, Flume o Kafka. Aprende a transformar datos estructurados y semiestructurados con herramientas ETL usando Spark, Pig y MapReduce.
Investiga y aprende en qué consiste el proceso de análisis de datos, la creación de modelos y el funcionamiento general de herramientas y librerías especializadas de Spark o Mahout. También explora cómo se pueden visualizar los datos y las herramientas de notebooks como Zeppelin o Jupyter. No es necesario que seas experto, pero debes tener una visión completa del proceso para tomar mejores decisiones en el futuro.
En cada uno de estos pasos, asegúrate de investigar y entender cómo mantener los datos seguros y en qué consisten las buenas prácticas.
Profundiza en tu formación
Llegado a este punto, tendrás muchas preguntas. No te desanimes y pregunta. Escribe artículos en tu blog para ayudar a la comunidad y ofrecer tu ayuda de vuelta. Intenta aprender cada día algo nuevo y escríbelo en un artículo. Tan solo 30 minutos al día pueden significar una gran diferencia y acelerar tu aprendizaje. Puedes ver vídeos, hacer tutoriales o leer documentación.
Documenta todo lo que vas aprendiendo. Ya sea en un blog, en un repositorio de GitHub o en vídeos de Youtube. Es de las mejores formas de mostrar lo que conoces y añadirlo al CV. Te da credibilidad para empezar con menos experiencia.
Los cursos online están bien para aprender rápidamente y asimilar la información de una manera compactada, pero no son una certificación. No demuestran nada pero están ahí para que los aproveches. Te recomiendo hacer estos cursos para ingeniero de datos en Udemy, en mi opinión te facilitarán adoptar los conceptos fundamentales rápidamente.
Además, te recomiendo echar un ojo a mis listas de libros recomendados:
- Libros recomendados para Big Data
- Mejores libros de Data Science
- Mejores libros de Arquitectura del Software
- Libros recomendados de Programación y desarrollo de Software
Paso 3 – Proyecto de Ingeniería de datos
Pienso que la clave para convertirte en un buen profesional es la experiencia. Y para demostrarla no hay nada mejor que poner en práctica los conocimientos que has adquirido en uno o más proyectos.
Como primera experiencia, puedes iniciar un proyecto sencillo, usando algunas de las tecnologías que anotaste en la investigación del paso 0. Este proyecto puede consistir en implementar una pequeña ETL o una plataforma de procesamiento de datos con datasets abiertos y disponibles online. Este proyecto, también es fundamental para documentarlo de la forma en la que te sientas cómodo, como comenté en el paso anterior, usando un blog, Github o en vídeo.
Aquí tienes un artículo con 5 ideas de proyectos para ingenieros de datos.
Cuando te sientas cómodo puedes involucrarte en un proyecto open source. Esto te dará la oportunidad de obtener la experiencia necesaria para demostrar tus habilidades ante tus clientes o empresas. Hay multitud de proyectos interesantes en los que participar. Puedes empezar por revisar los proyectos de la Apache Software Foundation sobre Big Data. Regístrate en su lista de correos y empieza a investigar las particularidades del proyecto, qué tareas te parecen sencillas y cómo involucrarte. Una buena forma de empezar puede ser con las tareas relacionadas con la documentación. Estas tareas a la vez te ayudarán a familiarizarte con el modo de trabajar.
Paso 4 – Experiencia
Antes de aplicar a las ofertas de empleo deberás tener un Currículum actualizado donde indiques tus proyectos y las tecnologías que conoces y que has usado. Puedes ajustar este CV a cada oferta que te interese y describas exactamente lo puedes hacer y cómo puedes ayudar a la organización.
Por último, descubre qué es lo que más te gusta y especialízate en esa tecnología o nicho. Dependiendo de tu carrera te centrarás más en algunos aspectos que en otros e incluso variarán en el tiempo.
Lectura Recomendada: