En esta entrada, he recopilado los vídeos que te guiarán para aprender y convertirte en ingeniero de datos en la plataforma Google Cloud (GCP). Es un curso práctico y desde cero orientado a estudiantes de ingeniería de datos. Espero que te guste.
Contenidos
1. Análisis de Datos con Google BigQuery
Introducción al Análisis de Datos con la consola de Google BigQuery:
- 0:00 Qué es BigQuery
- 00:36 Preparar el Entorno
- 02:27 Exploración y Análisis de Datos
2. Preguntas y Respuestas Professional Data Engineer Google Cloud
Preguntas y Respuestas de Ejemplo para la certificación de Google Cloud Professional Data Engineer
3. Cómo Cargar Datos en Google Cloud SQL
Tutorial básico de cómo cargar datos en Google Cloud SQL con la Cloud Shell
- 00:00 Introducción
- 00:41 Preparación de Consola Cloud Shell
- 02:55 Creación de Tabla en Consola
- 03:50 Copia de Datasets en Google Cloud
- 04:30 Comprobación de integridad de los datos
4. Cómo Cargar Datos en BigQuery
Tutorial básico de cómo cargar datos en BigQuery
- 00:00 Introducción
- 00:30 Creación de Dataset en BigQuery
- 01:10 Ingesta de Dataset en BigQuery
- 02:06 Consultas sobre el Dataset
- 02:30 Ingesta en BigQuery con Cloud Shell
5. JSON y Array en BigQuery
Tutorial de uso de JSON y Arrays en BigQuery
- 00:00 Introducción
- 00:31 Creación de Dataset de prueba
- 01:02 Creación de Dataset de prueba
- 02:42 Creación de Tabla en Bigquery
- 03:38 Creación de Arrays en Bigquery
- 06:02 Structs en Bigquery
- 07:56 JSON en Bigquery
- 08:44 Consultas de prueba
6. Como ejecutar Trabajos SPARK en Cloud DATAPROC
Aprende a ejecutar trabajos spark en el servicio de Google Cloud Dataproc
- 00:00 Introducción
- 00:26 Preparación de Cloud Shell
- 01:17 Creación de Cluster Dataproc
- 02:21 Preparación de código dataproc
- 03:00 Notebooks Jupyter en Dataproc
- 04:32 Modificación de Trabajos Spark
- 06:37 Ejecución de trabajos Spark sin notebook
7. Pipeline Simple en Java con DATAFLOW: Análisis serverless de datos
Aprende a ejecutar una pipeline simple en Java desde la cloud shell en el servicio de Google Cloud Dataflow
- 00:00 Preparación de Cloud Shell
- 00:57 Configuración de permisos IAM
- 01:19 Repositorio de Ejemplo
- 01:39 Creación de Bucket
- 02:26 Api de Dataflow
- 02:39 Código de la Pipeline en Dataflow
- 03:52 Ejecución de la pipeline en Dataflow
8. Pipeline de datos en Apache Beam Python y Java
Aprende a ejecutar una pipeline simple en Python y Java con Apache Beam para Google Cloud
- 00:00 Introducción
- 00:14 Preparación de Máquina Virtual en Python
- 01:57 Preparación de Máquina Virtual en Java
- 02:38 Ejecución de la pipeline con Java
9. Side Inputs en Dataflow con Python y Java
Aprende a ejecutar una pipeline en Python y Java con Side Inputs para Google Cloud
- 00:00 Introducción
- 00:30 Permisos de Dataflow en IAM
- 01:01 API de Dataflow
- 01:20 Preparación de Máquina virtual
- 02:27 Bigquery
- 03:12 Código de la pipeline con Dataflow
- 03:45 Ejecución de la pipeline con Dataflow
10. Ejecutando una pipeline con Cloud Data Fusion
Aprende a configurar y ejecutar una pipeline con Cloud Data Fusion
- 00:00 Introducción a Cloud Data Fusion
- 01:04 Configuración de Cloud Data Fusion
- 02:20 Lectura de datos de Cloud Storage Bucket
- 04:34 Filtrado de datos
- 04:55 Transformación de datos
- 05:45 Integración con Bigquery
- 07:58 Configuración de Sink
- 08:36 Ejecución de la Pipeline
11. Introducción a Cloud Composer
Aprende qué es y cómo ejecutar flujos de datos con Cloud Composer
- 00:00 Introducción
- 00:30 Preparación del entorno
- 01:58 Introducción a Airflow
- 03:18 Ejecución de DAG
12. Copia de datos con Cloud Composer
Aprende cómo ejecutar copias de datos con Cloud Composer y BigQuery en Google Cloud
- 00:00 Introducción
- 01:08 Configuración de Buckets de Cloud Storage
- 01:49 Workflow en python
- 02:32 Entorno de ejecución Python
- 02:45 Variables en Airflow
- 03:20 Ejecución de la Pipeline
13. Dataflow: IAM y Networking
Aprende cómo establecer los permisos IAM y el networking para tus trabajos de Dataflow
- 00:00 Configuraciones previas
- 00:47 Creación de bucket en cloud storage
- 01:13 Ejecución de un job en Dataflow
- 02:06 Configuración de permisos IAM
- 02:56 Deshabilitado de IPs Públicas
- 03:27 Actualización de Roles
14. Procesamiento de Datos con Dataflow y BigQuery
Aprende a procesar datos con Dataflow y BigQuery
- 00:00 Introducción
- 00:31 Configuración del entorno
- 01:55 Bigquery
- 02:21 Creación del Flujo de Datos
- 04:59 Mejora de la pipeline
- 05:57 Enriquecimiento de datos
- 06:38 Lectura de dos fuentes de datos en Bigquery
15. Dashboards y Reportes con Looker Studio
Aprende a crear Dashboards y Reportes con Looker Studio
- 00:00 Introducción Looker Studio
- 00:46 Creación de Fuente de Datos con Bigquery
- 02:21 Visualización sencilla
- 02:50 Gráficos de Barras
- 04:42 Custom Queries y Vistas
16. Tablas Particionadas en BigQuery
Aprende a optimizar tus consultas con Tablas Particionadas en BigQuery
- 00:00 Qué son las particiones
- 01:58 Optimización en Bigquery con Particiones
- 02:53 Periodo de Expiración
17. Optimización de Consultas en BigQuery
Aprende a optimizar tus consultas en BigQuery
- 00:00 Optimización de Consultas en Bigquery
- 00:44 Operaciones de Entrada y Salida
- 03:12 Cache en Bigquery
- 03:59 Vistas Materializadas y Tablas Temporales
- 04:06 Joins
- 07:13 Operaciones de Agrupación
- 08:32 Funciones de Agregación Aproximada
18. Prepara tus datos con Cloud DataPrep
Aprende a preparar tus Datos con el servicio Cloud Dataprep
- 00:00 Introducción
- 00:28 Preparación del Entorno
- 01:31 Conectar Dataprep con Bigquery
- 02:11 Explorar datos con Dataprep
- 03:47 Preparación de Datos con Dataprep
- 07:33 Ejecución de Pipeline con Dataprep
19. Pipelines de Datos con Vertex AI
Ejecuta tus pipelines de Machine Learning con Vertex AI
- 00:00 Introducción
- 00:29 Configuración del Entorno
- 01:23 Configuración del código de la Pipeline
- 02:14 Ejecución de la pipeline de IA
20. Jupyter Notebook en Vertex AI
Ejecuta tus notebooks de Jupyter con Vertex AI en Google Cloud
- 00:00 Introducción
- 00:24 Ejecución de una instancia de Jupyterlab
- 01:16 Ejecución de consulta de biguery
- 02:17 Creación de gráfica con Pandas
21. Machine Learning en Bigquery: Sistemas de Recomendación
Aprende a usar Bigquery Machine Learning para hacer sistemas de recomendación
- 00:00 Cómo usar Bigquery Machine Learning
- 00:47 Carga de datos en BigQuery
- 01:24 Exploración del dataset
- 02:10 Evaluación de modelo preentrenado
- 02:47 Ejemplo de sistema de recomendación
22. Clasificación de Textos con Natural Language AI
Aprende a usar la Natural Language API para clasificar textos
- 00:01 Cloud Natural Language API
- 00:29 Activación y preparación de la API
- 01:29 Clasificación de textos
- 02:48 Clasificación de grandes textos
- 03:38 Almacenamiento de resultados en bigquery
23. Streaming de Datos a Pub/Sub
Streaming de datos de sensores en tiempo real a Google Cloud Pub/Sub
- 00:01 Google Cloud Pub/Sub
- 00:34 Preparación del entorno
- 01:20 Creación del topic y la suscripción en Pub/Sub
- 03:05 Simulación de datos de sensores en Pub/Sub
- 04:28 Verificación de mensajes recibidos
24. Streaming de Datos a a BigTable
Streaming de datos de sensores en tiempo real a de Google Cloud Pub/Sub a BigTable
- 00:01 Google Cloud Pub/Sub
- 00:21 Preparación
- 01:14 Simulación de tráfico de sensores en Pub/Sub
- 02:02 Ejecución de la pipeline de dataflow
- 03:50 Consulta de los datos de bigtable
25. Streaming de Datos en Google Cloud
Streaming de Datos en Google Cloud
- 00:01 Google Cloud Pub/Sub
- 00:30 Preparación
- 01:48 Ejecución de la pipeline de Dataflow
- 02:48 Monitorización de la pipeline
- 04:19 Throughput rate y autoscaling
- 06:24 Cloud Monitoring
- 09:02 Creación de dashboards
26. Predicción de Compras con Big Query Machine Learning
Aprende a crear modelos de Machine Learning y realizar predicciones de forma sencilla en BigQuery
- 00:01 Big Query Machine Learning
- 00:26 Preparación del entorno
- 03:15 Creación del modelo de machine learning para predicción
- 06:19 Evaluación del modelo
- 07:20 Mejora de la calidad del modelo
- 08:47 Uso del modelo para predicción