Durch Anklicken „Akzeptieren“, stimmen Sie der Speicherung von Cookies auf Ihrem Gerät zu, um die Seitennavigation zu verbessern, die Nutzung der Website zu analysieren und unsere Marketingaktivitäten zu unterstützen. Sehen Sie sich unsere an Datenschutzrichtlinie für weitere Informationen.
Sep 4, 2024
Y42

Datenmodellierung per Drag-and-Drop in Y42 (Teil 2)

Verwenden Sie Funktionsknoten, um Ihre Daten zu transformieren. Von Deborah Menezes

In der letzten Blog Artikel aus dem Y42 In der Serie haben wir behandelt, wie Datenmodelle mit Y42 erstellt werden. Wir haben die Schritte beim Bau von Pipelines mithilfe des Y42-UI-Modells besprochen und darüber, wie Feldknoten manipuliert werden können. Lassen Sie uns gleich darauf eingehen, wie Funktionsknoten unsere F1-Daten weiter definieren können!


Sanu hat bereits erklärt, wie Sie das Modell erstellen und Tabellenmanipulationen durchführen können. Sobald unser Datenmodell fertig ist, können wir mit der Transformation unserer Daten beginnen, indem wir verschiedene Drag-and-Drop-Knoten verwenden, die verschiedene Funktionen enthalten, die sich auf das gewünschte Endergebnis beziehen. Hier werde ich einige der wichtigen SQL-Funktionen für die Manipulation von Spalten erklären.

UI-Modellierung

Zuerst betreten wir die Modellierungsebene. Dann wählen wir die „Spaltenmanipulationen“ aus. Hier sehen wir alle Funktionen, die für die Spalten verwendet werden können.

Bildschirmfoto 2022-06-23 um 19.59.36.png

Funktionen: Knoten 101

Es gibt viele Fälle, in denen erweiterte Funktionen und logische Anweisungen in Ihren Modellen erforderlich sind, und dies erfordert ein wenig Programmierkenntnisse. Wir bieten auch einen Bigquery-Kurs auf Udemy an, falls du mehr über Programmieren erfahren möchtest. Aus diesem Grund hat Y42 den Knoten Functions eingeführt.

Mit dem Knoten Functions können Sie Folgendes ausführen:

  • Zahlenfunktionen: Dies sind mathematische/arithmetische Berechnungen, bei denen Sie numerische Felder addieren, subtrahieren, dividieren oder multiplizieren können. Darüber hinaus können Sie auch die Werte Ceil, Floor und Round oder den Absolutwert eines bestimmten Feldes berechnen.

  • Textfunktionen: Dies sind die Funktionen, mit denen Text- oder Zeichenkettenfelder bearbeitet werden können. Einige Beispiele hierfür sind das Zuschneiden von Text, das Ändern in Groß- oder Kleinbuchstaben, das Ersetzen von Text, das Teilen usw.

  • Boolesche Funktionen: Dies sind die Funktionen, die bestimmten binären Bedingungen folgen und entweder als wahr oder falsch zurückgeben. Einige Beispiele für boolesche Funktionen oder Operatoren sind AND, OR, NOT, GREATER_THAN, LESS_THAN, CONTAINS usw.

  • Funktionen für Datum und Uhrzeit: Mit diesen Funktionen können Sie Datumswerte subtrahieren, Datumswerte kürzen und Typen umwandeln, um die Daten in eine DateTime- oder Zeitstempeldatei umzuwandeln.

Hinzufügen eines Functions-Knotens zu Ihrem Modell

Wenn ein Funktionsknoten ausgewählt ist, kann er per Drag & Drop in die Leinwand gezogen werden. Er muss mit einem gültigen Eingabeknoten im Canvas verbunden sein, um verwendet zu werden, d. h. das Modell sollte bereits eine importierte Datenquelle in Y42 haben, was wir in der vorheriger Beitrag. Bitte schauen Sie sich das für eine Auffrischung an.

Sobald ein bestimmtes Feld eingegeben wurde, das transformiert werden muss, wird automatisch der Datentyp angezeigt. Es empfiehlt sich immer, Ihrem Funktionsknoten einen Namen zu geben, um zu verstehen, welche Transformation gerade stattfindet, da Sie in Ihrem Modell mehrere Knoten haben können, was ziemlich verwirrend werden kann.

Bildschirmfoto 2022-06-23 um 19.59.49.png

Richten Sie Ihren Functions-Node ein

Klicken Sie auf den Knoten Funktionen, um die Einstellungen zu übernehmen. Auf der rechten Seite haben Sie Zugriff auf die Dokumentation für jede verfügbare Funktion

Bildschirmfoto 2022-06-23 um 19.59.58.png

Hier können Sie die Spalten nach Belieben transformieren. Sie können entweder eine neue erstellen oder dieselbe bearbeiten.

  • Nehmen wir zum Beispiel an, Sie müssen die Namen der Mitarbeiter in Großbuchstaben schreiben, dann können Sie eine neue Spalte 'upper_name' erstellen. Geben Sie dazu den Spaltennamen „upper_name“ in die Zielspalte ein und geben Sie in das Formelfeld UCASE (@name) ein. Die Ergebnisse sehen dann wie folgt aus:
Bildschirmfoto 2022-06-23 um 20.00.07.png
  • Oder wenn Sie einfach nur alle Namen in Großbuchstaben benötigen, können Sie in der Zielspalte die Namensspalte auswählen und sie wird durch bearbeitete Werte ersetzt.
Bildschirmfoto 2022-06-23 um 20.00.24.png
  • Wenn Sie in Y42 die Spalte auswählen, die Sie verwenden möchten, muss sie immer mit dem @-Symbol beginnen.

​​

  • Sie können die Funktion oder eine Kombination von Funktionen auswählen, die Sie auf Ihre Daten anwenden möchten. Sobald Sie sie hinzugefügt haben, können Sie das Ergebnis der Transformation überprüfen, indem Sie auf Ausgabe klicken. Wenn Sie bereit sind, klicken Sie auf Speichern.
Bildschirmfoto 2022-06-23 um 20.00.40.png
  • Denken Sie daran, Ihr Modell nach der Durchführung von Transformationen zu speichern, indem Sie auf Commit Model klicken. Um mehr Einblicke in die Versionshistorie zu erhalten, fügen Sie dem Commit einen kleinen Kommentar hinzu.
Bildschirmfoto 2022-06-23 um 20.00.55.png
  • Sie können mehrere Transformationen innerhalb eines einzelnen Funktionsknotens durchführen, jedoch nur eine Transformation pro Spalte pro bestimmter Funktion.

Verwenden des Functions-Knotens in unserem Modell

Wie bereits erwähnt, lieben wir die F1-Rennen sehr. Jedes Jahr während des F1-Rennens senden wir ein Formular an unsere Teammitglieder, die versuchen vorherzusagen, wer das Rennen gewinnen würde. Außerdem sammeln wir sogar die 5 besten Spieler und das beste Team. Die Daten werden einen Tag vor dem Rennen gesammelt und die Punkte werden berechnet. Wir haben also eine Erfolgsbilanz von jedem Rennen und jedem Teilnehmer mit Punkten. Diese Daten wurden in Y42 integriert und der vorherige Blog zeigt Ihnen, wie wir das gemacht haben. Der nächste Schritt besteht darin, zu verstehen, wie die Daten mithilfe von Datenmodellierung manipuliert werden können, was ebenfalls hier erklärt wird.

  • Wir verwenden die CONCAT-Funktion, wir verbinden zwei Spalten miteinander, indem wir einen Bindestrich dazwischen verwenden, wie in der Abbildung unten zu sehen ist. Der Name der Zielspalte wird eingegeben, hier season_round.
Bildschirmfoto 2022-06-23 um 20.01.08.png
  • Dann verwenden wir eine IF-Bedingungsanweisung, um den Gewinner anzuzeigen, wenn der Fahrer auf dem ersten Platz ist, indem wir die result_position verwenden, die den Rang des Teilnehmers enthält.
Bildschirmfoto 2022-06-23 um 20.01.16.png

Fazit

Zusammenfassend haben wir die UI-Modellierungsebene des Y42 noch einmal untersucht, wobei wir uns auf den Functions-Knoten konzentriert und erklärt haben, wie er verwendet wird. Wir haben es dann in unser eigenes Modell über F1-Rennen implementiert, indem wir die Saison und die Rundennummer miteinander verkettet haben, um herauszufinden, welcher Fahrer das Rennen gewonnen hat.


Ich werde diese Sitzung vorerst hier beenden, aber in den kommenden Beiträgen Sanu und ich werde mich eingehender mit anderen Knoten und ihren Funktionen befassen, die uns dabei helfen werden, unsere Daten so zu transformieren, wie wir sie wollen. Am Ende werden wir unser eigenes F1 2022 Datadice-Dashboard erstellen und sehen, wer die Gewinner sind!

Weitere Links

Folge uns auf LinkedIn für Einblicke in unsere tägliche Arbeit und wichtige Updates zu BigQuery, Data Studio und Marketing Analytics.

Abonniere unseren YouTube-Kanal für Diskussionen zu DWH, BigQuery, Looker Studio und Google Tag Manager.

Wenn Sie BigQuery von Grund auf lernen möchten, erhalten Sie Zugriff auf unsere kostenloser BigQuery-Kurs

Verbessern Sie Ihre Fähigkeiten mit Google Data Studio und BigQuery, indem Sie sich für unser Udemy-Kurs.

Benötigen Sie Hilfe bei der Einrichtung eines modernen, kostengünstigen Data Warehouse oder eines analytischen Dashboards? Senden Sie uns eine E-Mail an hello@datadice.io um einen Anruf zu vereinbaren.