Même si certains chanceux ont eu accès à une version privée en préversion des mois à l’avance, le dévoilement officiel de Microsoft Fabric a eu lieu seulement le 23 mai 2023. Selon moi, c’est la plus grosse annonce de la part de Microsoft depuis… la création de Power BI. Microsoft Fabric est la seule offre SaaS qui permet de gérer TOUS les volets d’un projet analytique et sciences de données : de l’ingestion à la consommation. Cet article ne vise qu’à vous dévoiler, en ordre dispersé, ce que sont à mes yeux, les points forts de cette nouvelle offre en émergence.
1. C’est une offre SaaS, c’est-à-dire que vous n’avez pas à vous soucier de bâtir l’infrastructure technologique pour tous les volets de la solution analytique et tous les paliers (DEV, TEST, PROD)
Par opposition à des solutions PaaS comme Azure Data Lake, Azure SQL Database, Azure Data Factory, etc.
2. Le portail Web pour gérer Microsoft Fabric est… celui de Power BI (app.powerbi.com)!
3. L’architecture repose sur un stockage logique unifié (OneLake) utilisant un format standard dans l’industrie (Delta-Parquet) optimisé pour Power BI (mais compatible avec la norme).
4. Les espaces de travail Power BI, appuyés sur des capacités Power BI Premium ou Fabric, serviront d’espace de collaboration pour tous les collaborateurs du projet.
5. Chaque persona d’un projet analytique pourra utiliser les outils qui lui sont familiers. Voici tous les objets Microsoft Fabric que nous pourrons créer au sein d’un espace de travail Power BI :
6. Peu importe l’outil utilisé pour ingérer et transformer les données (Spark, Dataflows, T-SQL), le format sous-jacent sera toujours des fichiers Delta-Parquet. La sécurité n’est pas encore disponible, mais la vision est de pouvoir la définir à un seul endroit :
7. Power BI ajoute un nouveau mode d’accès aux données, le mode Direct Lake :
8. Microsoft souhaite faire de OneLake le « OneDrive of Data » et une extension optionnelle permet de visualiser le contenu des espaces de travail auxquels nous avons accès directement dans Windows Explorer :
9. OneLake sera compatible avec tous les outils qui fonctionnaient sur Azure Data Lake Storage Gen2 (ADLSv2)
10. Inutile de dupliquer les données qui sont déjà dans ADLSv2 ou Amazon Bucket S3, grâce aux « Shortcuts ». Microsoft affirme que la performance est équivalente et assure la compatibilité. Une approche similaire, appelée « Mount », sera disponible pour certaines bases de données (ex. Azure SQL Database).
11. Certaines fonctionnalités de Microsoft Purview seront gratuites. D’ailleurs, en ayant une visibilité sur toute la solution analytique, la gouvernance sera grandement améliorée, tout comme la traçabilité, les analyses d’impact, etc.
12. Il sera possible d’intégrer un espace de travail Power BI à un repo Git dans Azure DevOps pour garder une trace des modifications (et synchroniser dans un sens ou dans l’autre).
13. Il est possible d’essayer Microsoft Fabric gratuitement pour 60 jours (et probablement d’allonger la période d’essai). Parlez-en à votre administrateur Power BI, oups je veux dire votre administrateur Fabric (oui ils ont changé le nom du rôle dans Azure).
14. Le prix de base est beaucoup moins élevé que Power BI Premium, alors il risque d’intéresser plusieurs organisations, vu la valeur offerte. Il est possible de l’utiliser en mode « Pay as you go », ce qui signifie qu’on peut réduire les coûts en fonctionnant en mode 12/5 plutôt que 24 heures sur 24, 7 jours sur 7 (24/7).
15. Gardez en tête que cette offre est en préversion et que Microsoft ne recommande pas d’aller en production avec cela avant au moins la version GA prévue pour la fin de l’année 2023.
J’espère vous avoir convaincu de vous intéresser à cette nouvelle offre sur le marché. Je creuserai certains sujets (il y en a tellement) dans mes prochains articles.