Descubre qué es Microsoft Fabric

  • Tiempo de lectura:10 minutos de lectura
  • Autor de la entrada:
  • Última modificación de la entrada:14/09/2024

¿Quieres saber en qué consiste Microsoft Fabric? En este artículo, damos las pinceladas más importantes a este conjunto de servicios para comprender cómo pueden ayudar a ingenieros y analistas de datos.

Microsoft Fabric

¿Qué es Microsoft Fabric?

Microsoft Fabric es un servicio SaaS (software-as-a-service) que mantiene todos los datos en una capa de almacenamiento llamada OneLake. Todas las plataformas analíticas acceden a este almacenamiento y los servicios que lo componen ofrecen escalabilidad y eficiencia en costes.

Fabric ofrece capacidades de almacenamiento de datos, de análisis y de procesamiento en tiempo real en entornos de nube pública.

También, unifica la experiencia de todos los productos de datos: su seguridad, gobierno, el cómputo, el almacenamiento y su modelo de negocio.

OneLake

OneLake es como Microsoft denomina al concepto de arquitectura basada en un lago de datos central.

Los servicios que ofrece Fabric se apoyan en el mismo almacenamiento, lo que facilita la colaboración de los equipos al poder almacenar, por ejemplo, un modelo de datos que va a ser usado por Synapse o por Power BI.

OneLake elimina la necesidad de copiar y de mover datos entre diferentes sistemas y equipos mediante el uso de OneCopy. A través de esta funcionalidad, podrás acceder a cualquier dato sin necesidad de montar procesos o ETLs de copia de datos.

Diagrama Microsoft Fabric

Todos los motores y aplicaciones almacenan sus datos en OneLake y se encuentran disponibles para otros motores de forma automática. Los motores analíticos escriben datos en formato Parquet o Delta.

Dentro de un mismo lago de datos o OneLake tendremos áreas de trabajo, en las que se proporcionan diferentes permisos a los usuarios.

OneLake está basado en Azure Data Lake Storage (ADLS) y permite almacenar datos en cualquier formato.

Servicios o Experiencias en Data Fabric

Ingeniería de Datos: Data Fabric nos aporta funcionalidades alrededor de Apache Spark similares a las de Azure Synapse, pero como SaaS en vez de como servicio PaaS. También, usa Synapse Data Warehouse con el rendimiento y la escalabilidad de SQL.

Integración de Datos con Data Factory. Combinando Power Query con la escala de Data Factory para mover y transformar datos.

Data science con Azure Machine Learning y Spark para entrenar modelos y ejecutar en un entorno escalable.

Analítica en tiempo real con Synapse usando KQL (Kusto Query Language). Este lenguaje está pensado para hacer consultas con datos que se reciben, se transforman y se envían en tiempo real. Normalmente los datos se transforman sin persistir y se extraen las conclusiones, que son las que se persisten. En la certificación DP-600 y DP-603 se trabaja más en concreto con datos en tiempo real y KQL.

Business Intelligence con Power BI para transformar datos en decisiones. Los warehouses y los Lakehouses están pensados para trabajar con Power BI. Es importante que los modelos de Power BI sean ligeros y tengan un backend potente. Si podemos crear mejores modelos de Power BI, es mucho más fácil crear informes y visualizaciones. Microsoft Fabric facilita este trabajo, minimizando los problemas de rendimiento, que pueden ser ocasionados por no usar modelos de datos eficientes.

Observabilidad con Data Activator. Este servicio se encarga de la detección en tiempo real y de ver qué está cambiando con nuestros datos. Es posible definir notificaciones y acciones si ocurre algo o si encontramos patrones en los datos.

Seguridad y Gobierno en Microsoft Fabric

En Fabric, todo el dato, su gobierno y la seguridad se encuentran centralizados en OneLake. Los datos son accesibles por cualquier usuario que lo necesite con los permisos adecuados.

La administración se realiza mediante el Admin Center, donde es posible asignar grupos y permisos a los usuarios de la organización. Además de esto, se pueden configurar las fuentes de datos y monitorizar el uso y el rendimiento.

Microsoft Fabric está integrado de forma transparente con Azure Purview Information Protection. Con esta integración, Fabric usará los tags de información sensible para proteger y clasificar los datos.

Al Admin Center también se puede acceder a través de su API y SDK, para automatizar tareas e integrarlo con otras aplicaciones.

Beneficios de Adoptar Microsoft Fabric

El principal beneficio de usar Microsoft Fabric es la facilidad que proporciona a los equipos para trabajar de forma colaborativa. Al usar una capa de almacenamiento única, se eliminan los silos de datos. También, se acerca el rol del analista al ingeniero de datos, para preparar los datos que son necesarios en los procesos de forma más efectiva.

Los analistas de datos también podrán ver el linaje y conectar con datos desde Power BI para hacer reportes más fácil.

Al ser una plataforma SaaS, los recursos se pueden escalar en cualquier momento en función de la necesidad para responder a la carga. Microsoft Fabric ofrece un modelo de escalabilidad horizontal elástica, lo que significa que puedes aumentar o reducir dinámicamente los recursos de tus aplicaciones en respuesta a la demanda sin interrumpir el servicio. Esta capacidad de escalar según sea necesario garantiza un rendimiento óptimo incluso en momentos de carga máxima.

Además, Fabric proporciona herramientas integradas para monitorizar y administrar tu infraestructura de manera eficiente. Con características como la monitorización en tiempo real y la detección automática de errores, puedes mantener un control total sobre el rendimiento.

Siguientes Pasos y Formación de Azure

Si quieres seguir profundizando en Azure y sus servicios de datos, aquí tienes mi recomendación de un curso actualizado. Te facilitará mucho la vida para aprender y además conseguirás una certificación para demostrar estos conocimientos.

Curso oficial de preparación al examen Microsoft Azure Data Fundamentals DP-900

El curso es ofrecido por Microsoft en la plataforma de formación online Coursera. Te enseñará los conceptos que necesitarás para obtener con éxito la certificación orientada a datos en Azure. Consta de 4 módulos:

  1. Conceptos básicos de datos en Azure
  2. Microsoft Azure SQL
  3. Azure Cosmos DB
  4. Analítica en Data Warehouses en Azure

Deja una respuesta