Qu'est-ce que Microsoft Fabric exactement
Microsoft Fabric est une plateforme SaaS lancée en GA (disponibilité générale) fin 2023. Elle regroupe sous un même toit plusieurs workloads data qui étaient auparavant des services distincts :
- Data Engineering : ingestion et transformation de données avec Spark, notebooks et pipelines
- Data Warehouse : entrepôt de données SQL géré avec T-SQL
- Data Science : notebooks Python/R pour le machine learning
- Real-Time Intelligence : ingestion et analyse de données en streaming
- Power BI : intégré nativement dans Fabric
- Data Factory : orchestration et connecteurs de données
Tout repose sur OneLake, un lac de données unifié où toutes les données de l'organisation sont stockées une seule fois au format Delta Lake (un format ouvert basé sur Parquet).
Le concept OneLake : ce qui change vraiment
OneLake est probablement l'innovation conceptuelle la plus importante de Fabric. Avant, chaque service Azure avait son propre stockage. Vous aviez des données dans Azure Data Lake, d'autres dans Azure Synapse, d'autres dans des datasets Power BI. Résultat : des copies de données partout, des problèmes de synchronisation, des coûts de stockage qui s'accumulent.
Avec OneLake, les données sont stockées une seule fois et tous les workloads Fabric y accèdent directement. Un notebook Spark, un entrepôt SQL et un rapport Power BI peuvent lire le même fichier Delta sans copie intermédiaire. C'est un changement architectural significatif.
C'est grâce à OneLake que Direct Lake fonctionne : Power BI peut lire directement les fichiers Delta dans OneLake avec des performances proches de l'import, sans avoir à charger les données en mémoire au préalable.
Ce qui fonctionne vraiment bien
L'expérience utilisateur unifiée
Pour un Data Analyst qui utilise à la fois Power BI, SQL et Python, Fabric est un confort réel. Tout est dans la même interface, les workspaces sont partagés, les permissions se gèrent en un seul endroit. La courbe d'apprentissage est plus douce qu'avec un stack Azure traditionnel.
Les Lakehouses
Le Lakehouse Fabric est une vraie réussite. Il combine la flexibilité d'un data lake (stockage de fichiers non structurés, formats variés) avec la capacité de requêter les données en SQL via un endpoint automatiquement généré. Pas besoin de définir un schéma à l'avance, mais vous pouvez quand même faire du SQL sur vos données.
L'intégration Power BI native
Power BI dans Fabric se connecte aux données Fabric sans configuration supplémentaire. Les modèles sémantiques partagés, la gestion des accès et la fraîcheur des données sont nettement plus simples à gérer qu'avec Power BI Premium standalone.
Ce qui est encore problématique
La tarification complexe
Fabric fonctionne sur un modèle de capacité (SKU F2 à F2048). Comprendre combien vous allez payer selon votre usage est un exercice en soi. Microsoft propose un calculateur, mais les surprises sur la facture ne sont pas rares pour les équipes qui n'ont pas bien dimensionné leur capacité au départ.
La maturité inégale selon les workloads
Power BI et Data Factory sont matures. En revanche, certaines fonctionnalités du Data Warehouse ou des pipelines Spark présentent encore des bugs ou des limitations qui ne se trouvent pas dans les services Azure équivalents plus anciens. Fabric s'améliore vite, mais des projets critiques sur des workloads moins matures peuvent être risqués.
La migration depuis l'existant
Si vous avez déjà un stack Azure (Synapse, Data Lake, Power BI Premium), la migration vers Fabric est possible mais pas triviale. Les outils de migration automatisée existent mais nécessitent quand même un travail de validation significatif.
Pour qui Fabric est fait
Fabric est particulièrement adapté à :
- Les entreprises qui démarrent un projet data from scratch et veulent éviter la complexité d'un stack Azure multi-services
- Les équipes existantes sur Power BI Premium qui veulent ajouter des capacités data engineering sans changer d'environnement
- Les organisations Microsoft-centric qui veulent rester dans l'écosystème
Fabric est moins adapté si vous avez des workloads critiques sur des services Azure matures que vous ne pouvez pas vous permettre de migrer, ou si vous avez des raisons de rester multi-cloud.
Verdict après plusieurs mois d'utilisation
Microsoft Fabric tient une partie de ses promesses. L'unification des workloads est réelle et apporte un gain de productivité mesurable pour les équipes data qui naviguaient entre plusieurs services. OneLake et Direct Lake sont de vraies innovations.
Mais Fabric reste une plateforme jeune sur certains workloads. Pour les équipes qui ont besoin de stabilité maximum et dont le stack Azure actuel fonctionne bien, il n'y a pas d'urgence à migrer. Pour les équipes qui démarrent ou qui cherchent à simplifier leur architecture, c'est clairement la direction à prendre.