Hi, ich bin Marcus und in diesem Blogartikel werfen wir einen detaillierten Blick auf das Power BI-Verwendungsszenario für erweiterte Datenaufbereitung. Im Gegensatz zur Self-Service-Datenaufbereitung steht hier die Mehrschichtigkeit im Vordergrund. Begleiten Sie mich in die Microsoft-Dokumentation und entdecken wir das entsprechende Szenario-Diagramm.
Einführung in die erweiterte Datenaufbereitung
Bei der erweiterten Datenaufbereitung geht es darum, Daten in mehreren Schichten zu transformieren und zu verarbeiten. Dies erfordert oft den Einsatz von Premium-Kapazitäten oder Fabric-Kapazitäten in Power BI, die erweiterte Funktionalitäten in Power Query Online ermöglichen.
Schrittweise Datenverarbeitung
1. Staging
Der Prozess beginnt mit einem Dataflow-Creator, der sich am Power BI Service anmeldet und Power Query Online verwendet. Die erste Schicht der Datenverarbeitung ist das sogenannte Staging. Hier werden die Daten aus den Quellen geladen und innerhalb des Dataflows gespeichert. Ziel ist es, die Daten von der ursprünglichen Quelle zu entkoppeln und eine gleichbleibende Datenbasis zu schaffen, die in unserem Arbeitsbereich als CSV-Dateien vorliegt.
2. Transformation
In der nächsten Schicht erfolgt die eigentliche Datentransformation. Hier kommen Premium-Entitäten wie Linked Tables und Computed Tables zum Einsatz:
Linked Tables: Diese Tabellen sind in einem Dataflow verfügbar, wurden aber in einem anderen Dataflow erstellt. Dadurch wird ein Doppelladen vermieden.
Computed Tables: Diese Tabellen werden auf Basis von bereits vorhandenen Tabellen innerhalb eines Dataflows berechnet.
Die Transformation findet innerhalb des Power BI Service statt und erfordert erhebliche Rechenleistung, die über Premium- oder Fabric-Kapazitäten bereitgestellt wird.
3. Finalisierung
In der letzten Schicht werden die transformierten Daten für die endgültige Nutzung vorbereitet. Diese finale Datenaufbereitung sorgt dafür, dass die Daten für verschiedene Ziele optimiert sind. Die Daten werden in verschiedenen Ziel-Arbeitsbereichen bereitgestellt und weiter verfeinert.
Integration mit Azure
Neben der Speicherung innerhalb des Power BI Service können die Daten auch auf Azure Data Lake Storage Gen2 abgelegt werden. Dies ermöglicht den Zugriff auf die Daten von außerhalb und deren Nutzung in weiteren Prozessen, wie beispielsweise Data Science Projekten mit Spark Notebooks.
Nutzung der Dataflows
Die fertigen Dataflows werden schließlich für Berichtskonsumenten und Modellersteller innerhalb des Power BI Desktops geladen. Hier entsteht ein Datenmodell, auf dem Berichte aufgebaut werden können. Diese erweiterte Datenverarbeitung ermöglicht einen robusten Ladeprozess, der durch die Premium-Kapazitäten unterstützt wird und keine umfangreiche IT-Infrastruktur erfordert.
Fazit
Die erweiterte Datenaufbereitung mit Power BI bietet eine mächtige und flexible Lösung für die Datenverarbeitung in mehreren Schichten. Mit den erweiterten Funktionalitäten von Power Query Online und der Unterstützung durch Premium-Kapazitäten können selbst komplexe Datenaufbereitungsprozesse effizient und benutzerfreundlich gestaltet werden.
Ich hoffe, dieser Blogartikel hat Ihnen einen guten Eindruck davon vermittelt, was mit Power BI im Rahmen der Datenaufbereitung möglich ist. Wenn Sie Fragen haben, hinterlassen Sie sie gerne in den Kommentaren. Bis zum nächsten Mal!
Comentários