Für eine effiziente Datentransformation ist es unerlässlich, den Lebenszyklus von Code in Dataform zu verstehen. Durch die Konfiguration der Kompilierungs- und Ausführungseinstellungen können Sie Dataform an Ihre spezifischen Anforderungen anpassen. Ganz gleich, ob es um die Verwaltung von Entwicklungsarbeitsplätzen, die Planung von Workflow-Ausführungen oder die Definition von Kompilierungsüberschreibungen geht, Dataform bietet eine umfassende Plattform für die effektive Verwaltung des Codelebenszyklus.
In unseren vorherigen Artikeln der Reihe „Erstellen einer Datenpipeline mit Dataform in BigQuery“ habe ich das behandelt Grundlagen von Dataform und seine Integration mit BigQuery von GCP. In dieser Ausgabe werde ich Sie durch den Prozess der Erstellung von Releasekonfigurationen und Workflow-Konfigurationen in Dataform für die geplante Ausführung führen und Ihnen so die Möglichkeit geben, Ihre Datenverarbeitung zu automatisieren und zu optimieren.
Lass uns eintauchen!
Versionskonfigurationen in Dataform bieten einen leistungsstarken Mechanismus für die Konfiguration und Ausführung von SQL-Workflows nach einem Zeitplan. Durch das Erstellen von Releasekonfigurationen können Sie Kompilierungseinstellungen definieren und die Häufigkeit der Generierung von Kompilierungsergebnissen festlegen. Sehen wir uns die Schritte an, die zum Erstellen von Release-Konfigurationen erforderlich sind.
Was sind Release-Konfigurationen?
Bevor wir fortfahren, wollen wir uns ein klares Bild von Release-Konfigurationen machen. Wenn Sie SQL-Workflows in Dataform entwickeln, wird der SQL-Code kompiliert, was zu einer Kompilierungsausgabe führt. Versionskonfigurationen bieten die Flexibilität, die Kompilierungseinstellungen anzupassen und Ausführungsumgebungen wie Staging oder Produktion einzurichten.
Eine Release-Konfiguration erstellen
Lassen Sie uns nun unseren Fokus auf die Erstellung der Release-Konfiguration verlagern. In dieser Phase werden die notwendigen Parameter und Spezifikationen für den Release-Prozess eingerichtet. Wir definieren die Schritte und Anforderungen, um eine reibungslose und erfolgreiche planmäßige Ausführung zu gewährleisten.
Um eine Release-Konfiguration in Dataform einzurichten, können Sie die folgenden Schritte ausführen:
Herzlichen Glückwunsch! Sie haben erfolgreich eine Release-Konfiguration in Dataform erstellt, mit der Sie SQL-Workflows nach einem Zeitplan konfigurieren und ausführen können. Indem Sie die Kompilierungseinstellungen definieren und die Häufigkeit der Erstellung der Kompilierungsergebnisse planen, können Sie die Ausführung Ihres Workflows automatisieren.
Dataform bietet eine leistungsstarke Funktion namens Workflow-Konfigurationen, mit der Sie die Ausführung von SQL-Workflows planen und konfigurieren können. Mit Workflow-Konfigurationen können Sie die Ausführung von Dataform SQL-Workflows nach einem Zeitplan Ihrer Wahl automatisieren. Lassen Sie uns untersuchen, wie Workflow-Konfigurationen erstellt und verwaltet werden.
Was sind Workflow-Konfigurationen?
Workflow-Konfigurationen in Dataform ermöglichen es Ihnen, die Ausführung von SQL-Workflow-Aktionen zu planen. Indem Sie eine Workflow-Konfiguration erstellen, können Sie eine Konfiguration für die Kompilierung auswählen, SQL-Workflow-Aktionen auswählen und den Ausführungsplan definieren.
Workflow-Konfiguration erstellen
Lassen Sie uns nun zum nächsten Schritt unserer Reise übergehen und eine Workflow-Konfiguration in Dataform erstellen. Diese Konfiguration wird eine wichtige Rolle bei der Organisation und Verwaltung der Ausführung unserer SQL-Workflows spielen. Durch die Einrichtung einer Workflow-Konfiguration können wir die Ausführung unserer Dataform SQL-Workflows gemäß unserem gewünschten Zeitplan automatisieren und optimieren.
Lassen Sie uns in den Prozess eintauchen und eine Workflow-Konfiguration erstellen, die unseren Anforderungen entspricht.
Sowohl Releasekonfigurationen als auch Workflow-Konfigurationen in Dataform dienen zwar dem Zweck, die Ausführung von SQL-Workflows zu verwalten, weisen jedoch deutliche Unterschiede in Bezug auf ihre Funktionalität und Anwendungsfälle auf.
Kurz gesagt, Releasekonfigurationen befassen sich hauptsächlich mit den Kompilierungseinstellungen und der Planung der Kompilierungshäufigkeit, während sich Workflow-Konfigurationen auf die Planung der Ausführung von SQL-Workflow-Aktionen, die Verwaltung von Abhängigkeiten und die Angabe des Ausführungszeitplans konzentrieren. Wenn Sie diese Konfigurationen zusammen verwenden, können Sie Ihre Datenverarbeitungspipelines effektiv automatisieren.
Wie bereits erwähnt, bestimmt die Release-Konfiguration die Kompilierungseinstellungen und generiert die Kompilierungsergebnisse für die SQL-Workflows. Indem Sie zuerst die Release-Konfiguration planen, schaffen Sie eine solide Grundlage, auf die sich die nachfolgenden Workflow-Konfigurationen verlassen können. Die Workflow-Konfiguration legt den Ausführungsplan fest und definiert, welche SQL-Workflow-Aktionen ausgeführt werden sollen. Sie stützt sich auf die von der Release-Konfiguration generierten Kompilierungsergebnisse, um die SQL-Workflows korrekt auszuführen.
Hier ist ein Beispiel zur Veranschaulichung der Planung von Release- und Workflow-Konfigurationen:
In diesem Beispiel soll die Release-Konfiguration mit der ID „DailyCompilation“ jeden Tag um 8:00 Uhr in der UTC-Zeitzone ausgeführt werden. Die Kompilierungsergebnisse werden während dieses Vorgangs generiert.
Die Workflow-Konfiguration mit der ID „DailyWorkflow“ soll täglich um 9:00 Uhr in der UTC-Zeitzone ausgeführt werden. Dieser Prozess basiert auf den Kompilierungsergebnissen der Release-Konfiguration und führt die angegebenen SQL-Workflow-Aktionen auf der Grundlage des Zeitplans aus.
Wenn Sie dieser Reihenfolge folgen, sind die Kompilierungsergebnisse verfügbar, bevor die Workflow-Ausführung beginnt. Dadurch wird sichergestellt, dass der Workflow den aktuellsten kompilierten Code für seine Aktionen verwendet.
In diesem Artikel wurde untersucht, wie Freigabe- und Workflow-Konfigurationen in Dataform für die geplante Ausführung erstellt werden. Versionskonfigurationen ermöglichen es Ihnen, die Kompilierungseinstellungen anzupassen und Ausführungsumgebungen zu erstellen, während Workflow-Konfigurationen es Ihnen ermöglichen, SQL-Workflow-Ausführungen zu organisieren und zu automatisieren. Durch die Nutzung dieser Funktionen können Sie die Ausführung Ihres Workflows optimieren und die Produktivität maximieren.
Folge uns auf LinkedIn für Einblicke in unsere tägliche Arbeit und wichtige Updates zu BigQuery, Data Studio und Marketing Analytics.
Abonniere unseren YouTube-Kanal für Diskussionen zu DWH, BigQuery, Looker Studio und Google Tag Manager.
Wenn Sie BigQuery von Grund auf lernen möchten, erhalten Sie Zugriff auf unsere kostenloser BigQuery-Kurs
Verbessern Sie Ihre Fähigkeiten mit Google Data Studio und BigQuery, indem Sie sich für unser Udemy-Kurs.
Benötigen Sie Hilfe bei der Einrichtung eines modernen, kostengünstigen Data Warehouse oder eines analytischen Dashboards? Senden Sie uns eine E-Mail an hello@datadice.io um einen Anruf zu vereinbaren.