Curso Gratis de Ingeniero de Datos en Google Cloud

  • Tiempo de lectura:25 minutos de lectura
  • Autor de la entrada:
  • Última modificación de la entrada:04/08/2024

En esta entrada, he recopilado los vídeos que te guiarán para aprender y convertirte en ingeniero de datos en la plataforma Google Cloud (GCP). Es un curso práctico y desde cero orientado a estudiantes de ingeniería de datos. Espero que te guste.

1. Análisis de Datos con Google BigQuery

Introducción al Análisis de Datos con la consola de Google BigQuery:

  • 0:00 Qué es BigQuery
  • 00:36 Preparar el Entorno
  • 02:27 Exploración y Análisis de Datos

2. Preguntas y Respuestas Professional Data Engineer Google Cloud

Preguntas y Respuestas de Ejemplo para la certificación de Google Cloud Professional Data Engineer

3. Cómo Cargar Datos en Google Cloud SQL

Tutorial básico de cómo cargar datos en Google Cloud SQL con la Cloud Shell

  • 00:00 Introducción
  • 00:41 Preparación de Consola Cloud Shell
  • 02:55 Creación de Tabla en Consola
  • 03:50 Copia de Datasets en Google Cloud
  • 04:30 Comprobación de integridad de los datos

4. Cómo Cargar Datos en BigQuery

Tutorial básico de cómo cargar datos en BigQuery

  • 00:00 Introducción
  • 00:30 Creación de Dataset en BigQuery
  • 01:10 Ingesta de Dataset en BigQuery
  • 02:06 Consultas sobre el Dataset
  • 02:30 Ingesta en BigQuery con Cloud Shell

5. JSON y Array en BigQuery

Tutorial de uso de JSON y Arrays en BigQuery

  • 00:00 Introducción
  • 00:31 Creación de Dataset de prueba
  • 01:02 Creación de Dataset de prueba
  • 02:42 Creación de Tabla en Bigquery
  • 03:38 Creación de Arrays en Bigquery
  • 06:02 Structs en Bigquery
  • 07:56 JSON en Bigquery
  • 08:44 Consultas de prueba

6. Como ejecutar Trabajos SPARK en Cloud DATAPROC

Aprende a ejecutar trabajos spark en el servicio de Google Cloud Dataproc

  • 00:00 Introducción
  • 00:26 Preparación de Cloud Shell
  • 01:17 Creación de Cluster Dataproc
  • 02:21 Preparación de código dataproc
  • 03:00 Notebooks Jupyter en Dataproc
  • 04:32 Modificación de Trabajos Spark
  • 06:37 Ejecución de trabajos Spark sin notebook

7. Pipeline Simple en Java con DATAFLOW: Análisis serverless de datos

Aprende a ejecutar una pipeline simple en Java desde la cloud shell en el servicio de Google Cloud Dataflow

  • 00:00 Preparación de Cloud Shell
  • 00:57 Configuración de permisos IAM
  • 01:19 Repositorio de Ejemplo
  • 01:39 Creación de Bucket
  • 02:26 Api de Dataflow
  • 02:39 Código de la Pipeline en Dataflow
  • 03:52 Ejecución de la pipeline en Dataflow

8. Pipeline de datos en Apache Beam Python y Java

Aprende a ejecutar una pipeline simple en Python y Java con Apache Beam para Google Cloud

  • 00:00 Introducción
  • 00:14 Preparación de Máquina Virtual en Python
  • 01:57 Preparación de Máquina Virtual en Java
  • 02:38 Ejecución de la pipeline con Java

9. Side Inputs en Dataflow con Python y Java

Aprende a ejecutar una pipeline en Python y Java con Side Inputs para Google Cloud

  • 00:00 Introducción
  • 00:30 Permisos de Dataflow en IAM
  • 01:01 API de Dataflow
  • 01:20 Preparación de Máquina virtual
  • 02:27 Bigquery
  • 03:12 Código de la pipeline con Dataflow
  • 03:45 Ejecución de la pipeline con Dataflow

10. Ejecutando una pipeline con Cloud Data Fusion

Aprende a configurar y ejecutar una pipeline con Cloud Data Fusion

  • 00:00 Introducción a Cloud Data Fusion
  • 01:04 Configuración de Cloud Data Fusion
  • 02:20 Lectura de datos de Cloud Storage Bucket
  • 04:34 Filtrado de datos
  • 04:55 Transformación de datos
  • 05:45 Integración con Bigquery
  • 07:58 Configuración de Sink
  • 08:36 Ejecución de la Pipeline

11. Introducción a Cloud Composer

Aprende qué es y cómo ejecutar flujos de datos con Cloud Composer

  • 00:00 Introducción
  • 00:30 Preparación del entorno
  • 01:58 Introducción a Airflow
  • 03:18 Ejecución de DAG

12. Copia de datos con Cloud Composer

Aprende cómo ejecutar copias de datos con Cloud Composer y BigQuery en Google Cloud

  • 00:00 Introducción
  • 01:08 Configuración de Buckets de Cloud Storage
  • 01:49 Workflow en python
  • 02:32 Entorno de ejecución Python
  • 02:45 Variables en Airflow
  • 03:20 Ejecución de la Pipeline

13. Dataflow: IAM y Networking

Aprende cómo establecer los permisos IAM y el networking para tus trabajos de Dataflow

  • 00:00 Configuraciones previas
  • 00:47 Creación de bucket en cloud storage
  • 01:13 Ejecución de un job en Dataflow
  • 02:06 Configuración de permisos IAM
  • 02:56 Deshabilitado de IPs Públicas
  • 03:27 Actualización de Roles

14. Procesamiento de Datos con Dataflow y BigQuery

Aprende a procesar datos con Dataflow y BigQuery

  • 00:00 Introducción
  • 00:31 Configuración del entorno
  • 01:55 Bigquery
  • 02:21 Creación del Flujo de Datos
  • 04:59 Mejora de la pipeline
  • 05:57 Enriquecimiento de datos
  • 06:38 Lectura de dos fuentes de datos en Bigquery

15. Dashboards y Reportes con Looker Studio

Aprende a crear Dashboards y Reportes con Looker Studio

  • 00:00 Introducción Looker Studio
  • 00:46 Creación de Fuente de Datos con Bigquery
  • 02:21 Visualización sencilla
  • 02:50 Gráficos de Barras
  • 04:42 Custom Queries y Vistas

16. Tablas Particionadas en BigQuery

Aprende a optimizar tus consultas con Tablas Particionadas en BigQuery

  • 00:00 Qué son las particiones
  • 01:58 Optimización en Bigquery con Particiones
  • 02:53 Periodo de Expiración

17. Optimización de Consultas en BigQuery

Aprende a optimizar tus consultas en BigQuery

  • 00:00 Optimización de Consultas en Bigquery
  • 00:44 Operaciones de Entrada y Salida
  • 03:12 Cache en Bigquery
  • 03:59 Vistas Materializadas y Tablas Temporales
  • 04:06 Joins
  • 07:13 Operaciones de Agrupación
  • 08:32 Funciones de Agregación Aproximada

18. Prepara tus datos con Cloud DataPrep

Aprende a preparar tus Datos con el servicio Cloud Dataprep

  • 00:00 Introducción
  • 00:28 Preparación del Entorno
  • 01:31 Conectar Dataprep con Bigquery
  • 02:11 Explorar datos con Dataprep
  • 03:47 Preparación de Datos con Dataprep
  • 07:33 Ejecución de Pipeline con Dataprep

19. Pipelines de Datos con Vertex AI

Ejecuta tus pipelines de Machine Learning con Vertex AI

  • 00:00 Introducción
  • 00:29 Configuración del Entorno
  • 01:23 Configuración del código de la Pipeline
  • 02:14 Ejecución de la pipeline de IA

20. Jupyter Notebook en Vertex AI

Ejecuta tus notebooks de Jupyter con Vertex AI en Google Cloud

  • 00:00 Introducción
  • 00:24 Ejecución de una instancia de Jupyterlab
  • 01:16 Ejecución de consulta de biguery
  • 02:17 Creación de gráfica con Pandas

21. Machine Learning en Bigquery: Sistemas de Recomendación

Aprende a usar Bigquery Machine Learning para hacer sistemas de recomendación

  • 00:00 Cómo usar Bigquery Machine Learning
  • 00:47 Carga de datos en BigQuery
  • 01:24 Exploración del dataset
  • 02:10 Evaluación de modelo preentrenado
  • 02:47 Ejemplo de sistema de recomendación

22. Clasificación de Textos con Natural Language AI

Aprende a usar la Natural Language API para clasificar textos

  • 00:01 Cloud Natural Language API
  • 00:29 Activación y preparación de la API
  • 01:29 Clasificación de textos
  • 02:48 Clasificación de grandes textos
  • 03:38 Almacenamiento de resultados en bigquery

23. Streaming de Datos a Pub/Sub

Streaming de datos de sensores en tiempo real a Google Cloud Pub/Sub

  • 00:01 Google Cloud Pub/Sub
  • 00:34 Preparación del entorno
  • 01:20 Creación del topic y la suscripción en Pub/Sub
  • 03:05 Simulación de datos de sensores en Pub/Sub
  • 04:28 Verificación de mensajes recibidos

24. Streaming de Datos a a BigTable

Streaming de datos de sensores en tiempo real a de Google Cloud Pub/Sub a BigTable

  • 00:01 Google Cloud Pub/Sub
  • 00:21 Preparación
  • 01:14 Simulación de tráfico de sensores en Pub/Sub
  • 02:02 Ejecución de la pipeline de dataflow
  • 03:50 Consulta de los datos de bigtable

25. Streaming de Datos en Google Cloud

Streaming de Datos en Google Cloud

  • 00:01 Google Cloud Pub/Sub
  • 00:30 Preparación
  • 01:48 Ejecución de la pipeline de Dataflow
  • 02:48 Monitorización de la pipeline
  • 04:19 Throughput rate y autoscaling
  • 06:24 Cloud Monitoring
  • 09:02 Creación de dashboards

26. Predicción de Compras con Big Query Machine Learning

Aprende a crear modelos de Machine Learning y realizar predicciones de forma sencilla en BigQuery

  • 00:01 Big Query Machine Learning
  • 00:26 Preparación del entorno
  • 03:15 Creación del modelo de machine learning para predicción
  • 06:19 Evaluación del modelo
  • 07:20 Mejora de la calidad del modelo
  • 08:47 Uso del modelo para predicción

Deja una respuesta