Was ist Power Query?

    Zu Power Pivot gesellte sich 2013 das 2. “Power”-Familienmitglied, das es schon gar nicht mehr gibt: Power Query. Ok, natürlich gibt es Power Query noch – nur heißt es heute “Get&Transform”. Im neuesten Familienmitglied, Power BI Desktop, hat es gar keinen eigenen Namen mehr. Wir erklären, was es mit diesem Werkzeug auf sich hat.

    ETL – oder: Wie komme ich an Daten?

    In Power Pivot kann der Nutzer Daten in das Datenmodell  laden. Je nach Datenquelle kann er sie dort auch filtern. Eine Änderung der Daten an dieser Stelle hat Microsoft allerdings nicht vorgesehen. Fehlende Datumsinformationen, falsch eingegebenen Kostenstellen, Artikelnummern kürzen, Dubletten löschen: All das musste dann doch wieder jemand aus der IT machen oder der Kollege, der sich gut in SQL auskennt.

    Im BI-Fachchinesisch hört man häufig die drei Buchstaben ETL. ETL steht für Extract Transform Load und bezeichnet die drei Prozessschritte, die bei der Datenbeschaffung durchlaufen werden:

    • Extract: Das Extrahieren der Daten aus einem Quellsystem (zum Beispiel einem ERP-System).
    • Transform: Häufig passt die Struktur der Daten im Quellsystem nicht mit der Struktur zusammen, die bei Auswertungen benötigt wird (siehe auch Star-/Snowflake-Schema). Die Daten müssen daher transformiert, ergänzt oder auch gelöscht werden.
    • Load: Die Daten werden in eine Zieldatenbank geladen und dort für Auswertungen abgelegt.

    Auch hier ist der Begriff nicht scharf abgegrenzt. In großen BI-Projekten finden mehrere Prozessschritte statt und mehrere Datenbanken kommen zum Einsatz.

    Power Query

    Ab Excel 2013 (wenig später auch für Excel 2010) fügte Microsoft ein neues AddIn hinzu: Power Query. Während Power Pivot in Excel 2013 bereits zum festen Inventar gehört, muss Power Query gesondert installiert werden.

    Power Query kennt eine Vielzahl Datenquellen, die Nutzer abgefragen können. In diese Abfragen kann der Benutzer dann eingreifen: Er kann Formate umstellen, Dubletten löschen, Artikelnummern kürzen, Kundengruppen filtern, um nur ein paar wenige der angebotenen Transformationen aufzuzählen. Die Transformationen werden als einzelne Schritte dargestellt, die er immer wieder rückgängig machen kann bzw. zwischen die er weitere Schritte einfügen kann. Das Ergebnis der Abfrage kann dann wahlweise in eine Excel-Arbeitsmappe oder in das Datenmodell geladen werden, sodass via Power Pivot darauf zugegriffen werden kann.

    Alle Transformationen in Power Query werden automatisch bei jeder Aktualisierung erneut ausgeführt. Und die Performance ist herausragend!

    Get&Transform

    So wie Power Pivot beim Wechsel von Excel 2010 zu Excel 2013 vom AddIn zum festen Bestandteil von Excel wurde, wurde Power Query mit dem Wechsel zu Excel 2016 fester Bestandteil. Nur empfand die Marketing-Abteilung von Microsoft den Namen “Power Query” als nicht mehr so vorteilhaft. Daher heißt Power Query seitdem “Get&Transform” und ist nur mit geübtem Auge im Excel-Menü von den alten Funktionen zum Abrufen externer Daten zu unterscheiden:

    image

    Die Sprache M

    Die Transformationsschritte, die ein Benutzer mit einfachen Mausklicks zusammenstellen kann, werden in eine interne Skriptsprache übersetzt. Versierte Benutzer können diese auch direkt selbst editieren. Die Sprache bringt eine Vielzahl Funktionen mit, um Leerzeichen zu löschen, Datumsformate anzupassen, Zeitspannen zweier Felder zu berechnen, zu Filtern und vieles, vieles mehr. Schön ist, dass die Sprache M ihren Namen behalten hat – egal ob Excel 2013 oder 2016 und egal ob Excel oder Power BI. Die Sprache bleibt gleich.

    Get&Transform in Power BI

    Für das neueste Produkt in der BI-Familie, Power BI Desktop, benötigte der Nutzer ebenfalls eine Möglichkeit Daten zu laden – und dabei ggf. zu ändern. Und Get&Transform ist ein wirklich tolles Stück Software. Also hat Microsoft diesen Teil direkt als festen Bestandteil in Power BI Desktop eingebaut. Dort hat es keinen eigenen Namen mehr. Aus Sicht von Power BI Desktop gibt es als Datenquelle nur den Weg über eine Oberfläche. Diese hieß in Excel eben mal Power Query, bevor Microsoft sie in Get&Transform unbenannt hat. In Power BI Desktop ist sie jetzt einfach da. Namenlos.

    Wir nennen Power Query weiterhin Power Query – und irgendwie glaube ich, dass der Name wieder zurückkommt Smile

    Lesen Sie auch unsere neuesten Blog-Artikel zu Power Query.

    Kategorien: Artikel, Grundlagen, Power Query
    Holger Gubbels

    Holger Gubbels ist Spezialist für alles, was mit Business Intelligence zu tun hat. Der Diplom-Informatiker strukturiert und löst als Data Scientist und Berater der mogular GmbH tagtäglich komplexe Problemstellungen rund um die Datenanalyse. Als Dozent der Hochschule für Technik Stuttgart ist er ein ausgewiesener Experte seines Fachs und gewohnt, Inhalte einfach zu erläutern. Genau das macht er auch hier in seinen Beiträgen für das PowerPivotInsights Blog. Zusätzlich ist er Autor für die Computerwoche und den Springer-Verlag. Sie erreichen ihn unter hg@mogular.com

    Antwort schreiben

    Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.