Durch Anklicken „Akzeptieren“, stimmen Sie der Speicherung von Cookies auf Ihrem Gerät zu, um die Seitennavigation zu verbessern, die Nutzung der Website zu analysieren und unsere Marketingaktivitäten zu unterstützen. Sehen Sie sich unsere an Datenschutzrichtlinie für weitere Informationen.
Sep 4, 2024
More

So modellieren Sie Zeitreihenprognosen mit Vertex AI AutoML

Eine einzigartige Lösung für ML ohne CODE: Googles Vertex AI ist die beste Plattform, um ML-Modelle mithilfe der AutoML-Funktion zu trainieren. Von Vaishnavee Baskaran

Die Google Cloud Platform bot eine einzigartige Plattform für alle KI-Lösungen. Vertex AI vereint AutoML und AI Platform zu einer einheitlichen API, Client-Bibliothek und Benutzeroberfläche. In Vertex AI können Sie Modelle einfach trainieren und vergleichen mit AutoML oder benutzerdefiniertes Codetraining.

In diesem Blog werden wir sehen, wie einfache Zeitreihen-Prognosemodelle mit AutoML erstellt werden. Außerdem können Sie mit AutoML Modelle anhand von Bild-, Tabellen-, Text- und Videodatensätzen trainieren, ohne Code schreiben zu müssen.

Um Vertex AI kostenlos zu testen, lesen Sie bitte Vertex KI Google Cloud und schauen Sie sich auch die an Tutorial-Videos von Google.

AutoML-Prognosemodell

In GCP ist die Vertex-KI eine einheitliche Benutzeroberfläche für den gesamten ML-Workflow. Um die Modelle für maschinelles Lernen zu trainieren und zu erstellen, besteht der erste Schritt darin, einen geeigneten Trainingsdatensatz auszuwählen und ihn vorzubereiten. Wählen Sie in den GCP-Produkten unter Künstliche Intelligenz die Option Vertex AI aus und rufen Sie die Dashboard-Benutzeroberfläche auf, wie im folgenden Screenshot gezeigt.

Bildschirmfoto 2022-10-19 um 17.15.53.png

Wählen Sie Datensatz erstellen, wie im obigen Screenshot hervorgehoben, um die Datenquelle als Trainingsdatensatz hinzuzufügen. Sie werden zur Seite „Datensatz erstellen“ weitergeleitet, auf der Sie den Namen des Datensatzes eingeben müssen. Vertex AI ist eine KI-Plattform für jedes ML-Tool, das Sie benötigen. Es ermöglicht Tabellen-, Bild-, Text- und Videoformate, um völlig neue intelligente Anwendungen oder bestehende Anwendungen zu erstellen, einschließlich Übersetzung und Sprache-zu-Text.

Bildschirmfoto 2022-10-19 um 17.29.17.png

In diesem Blog werden wir die Schritte zur Erstellung von Prognosemodellen mit AutoML durchgehen. Daher wählen wir „Tabellarisch“, um den Zielspaltenwert mithilfe des Klassifikations-, Regressions- und Prognosealgorithmus vorherzusagen. Klicken Sie auf „Prognose“, um die Trainingsdaten für die Zeitreihenprognose vorzubereiten.

Bildschirmfoto 2022-10-19 um 17.16.25.png

Die Datenquelle kann von einem lokalen Computer/Cloud-Speicher/BigQuery hochgeladen werden. Ich werde die Tabelle von BigQuery als Trainingsdaten für unser Modell hochladen.

Wählen Sie „Wählen Sie eine Tabelle oder Ansicht aus BigQuery aus“ und geben Sie dann den Tabellen- oder Ansichtspfad im angegebenen BigQuery-Pfad gemäß dem Format „ProjectId.datasetId.tableID“ an.

Bildschirmfoto 2022-10-19 um 17.16.43.png

Wie in der Abbildung unten gezeigt, werden Sie aufgefordert, die Serienidentifikationsspalte und die Zeitstempelspalte auszuwählen. Die Spalte mit der Reihenidentifizierung ist die Variable, die Beobachtungen in einer Zeitreihe eindeutig identifiziert. Beispielsweise unterscheidet die Spalte product_id unserer Tabelle Felder (andere Produkt-IDs) in einer Reihe bestimmter Zeiträume oder Intervalle voneinander (wir haben mehrere Produkt-IDs in unseren Daten, die auch als mehrere Zeitreihen bezeichnet werden), und die Timestamp-Spalte ist ein periodisches Feld in der Tabelle.

Bildschirmfoto 2022-10-19 um 17.17.03.png

Nachdem Sie die erforderlichen Felder wie oben hervorgehoben ausgewählt haben, wählen Sie nun Train New Model aus. Wie im folgenden Screenshot gezeigt, lautet der Name des Datensatzes product_price_forecasting und ich habe AutoML für das Training unseres Modells ausgewählt. Wir können auch ein benutzerdefiniertes Training erstellen, indem wir DL-Bibliotheken wie tf und ML-Bibliotheken wie sklearn codieren und Algorithmen boosten, was wir in den weiteren Blogs unserer Time-Series-Prognose-Blogserie sehen werden.

Google hat eine neue Modelltrainingsmethode namens Seq2Seq+ hinzugefügt, was Sequenz zu Sequenz bedeutet. Das Modell nimmt eine Sequenz von Elementen und gibt die Reihenfolge der Elemente aus, einfach als Encoder und Decoder unter Verwendung eines Deep-Learning-Algorithmus. Wir werden diese Art von Trainingsmodell bald auch in unserer Blogserie sehen.

Bildschirmfoto 2022-10-19 um 17.17.18.png

Nachdem Sie AutoML ausgewählt und auf Weiter geklickt haben, werden Sie wie in der Abbildung unten zur Seite mit den Modelldetails weitergeleitet. Sie sollten dem Modell einen entsprechenden Namen geben.

Konfiguration der Prognose

Zielspalte — der Wert, der vorhergesagt werden muss.

ZB: die Preisspalte

Datengranularität — der Zeitabstand zwischen den einzelnen Einträgen in der Zeitstempelspalte.

Beispiel: monthly gibt an, dass die Zeitstempelspalte in unserer Tabelle monatliche Einträge enthält.

Urlaubsregionen — wähle die jeweilige Urlaubsregion deiner Trainingsdaten aus.

Beispiel: EMEA (Europa)

Prognose Horizon — ist die Anzahl der zukünftigen Zeitschritte, die das Modell nach dem letzten Zeitstempel der angegebenen Daten vorhersagt.

Beispiel: In unserem Fall habe ich die Granularität als monatlich angenommen. Prognosehorizont 7 bedeutet also, dass unser Modell den Produktpreis für die nächsten 7 Monate vorhersagt.

Kontext-Fenster — ist das 0- bis 5-fache der Prognosehorizontwerte. In unserem Fall können wir also einen Wert zwischen 0 und 35 angeben.

Bildschirmfoto 2022-10-19 um 17.17.29.png

Sie können Ihren Testdatensatz auch in Ihr BigQuery-Projekt exportieren, indem Sie den entsprechenden Zielpfad von BigQuery angeben. Nachdem Sie auf Weiter geklickt haben, erhalten die Zeitstempelspalte, die Zielspalte und die Serienidentifikationsspalte automatisch den erforderlichen Feature-Typ und die Optionen Verfügbar bei Prognose. Für die übrigen Spalten müssen wir den Feature-Typ angeben, der angibt, wie sich das Feature auf seine Zeitreihe bezieht und ob es zum Prognosezeitpunkt verfügbar ist. Erfahren Sie mehr über Feature-Typ und Verfügbarkeit.

Bildschirmfoto 2022-10-19 um 17.17.37.png

Sobald Sie mit der Erstellung von Statistiken fertig sind, was eine Weile dauert, sollten Sie mit dem nächsten Schritt „Berechnung und Preisgestaltung“ fortfahren. Wie empfohlen. Die Knotenstunden werden anhand der Anzahl der Zeilen in unserem Datensatz berechnet.

Bildschirmfoto 2022-10-19 um 17.17.46.png

Lass uns eine Pause machen! Da es Stunden dauert, kannst du auch auf unserem anderen Blog vorbeischauenEinführung von BiqQuery ML'.

Jetzt wurde unser Modell erfolgreich trainiert. Gehen Sie in Vertex AI zu Modellen und wählen Sie den Namen Ihres Modells aus, um es zu evaluieren.

Bildschirmfoto 2022-10-19 um 17.17.54.png

Im folgenden Screenshot können Sie die Bewertungsergebnisse unseres trainierten Modells sehen. Die Merkmalsbedeutung jeder Spalte wird durch ein Balkendiagramm visualisiert, und Bewertungsmetriken wie MAE, MAPE und RMSE werden automatisch berechnet.

Bildschirmfoto 2022-10-19 um 17.18.19.png

Der nächste Schritt ist Batch Prediction. Wählen Sie Batch-Vorhersagen aus und erstellen Sie eine neue Batch-Vorhersage, indem Sie den Quell- und Zielpfad von BigQuery im angegebenen Format angeben.

Bildschirmfoto 2022-10-19 um 17.18.35.png

Machen Sie eine Kaffeepause!!!

Sobald die Batch-Vorhersage abgeschlossen ist, erhalten Sie eine automatisch generierte E-Mail in Ihrem Gmail-Konto, wie Sie sie für das Modelltraining erhalten haben.

Bildschirmfoto 2022-10-19 um 17.18.44.png

Wählen Sie das fertige Batch-Prognosemodell aus und wechseln Sie zum Exportspeicherort von BigQuery. Die Prognoseergebnisse werden im angegebenen Ziel im BigQuery-Pfad angezeigt, wobei der Name mit „prediction---------“ beginnt. Wenn Sie die Tabelle öffnen, könnten Sie drei Spalten wie predicted_price.value, predicted_price.lower_bound und predicted_price.upper_bound sehen, wie im folgenden Screenshot gezeigt.

Bildschirmfoto 2022-10-19 um 17.18.53.png

Das Modell prognostizierte im Vergleich zum tatsächlichen Preiswert ziemlich gute Ergebnisse. Unser nächster Schritt besteht nun darin, den prognostizierten Preiswert in Google Data Studio zu visualisieren. Gehen Sie in BigQuery zum Exportort für Batch-Prognosen und wählen Sie Exportieren aus. Sie werden die Optionen sehen, wie im folgenden Screenshot gezeigt.

Bildschirmfoto 2022-10-19 um 17.19.09.png

Wählen Sie Explore with Data Studio und fügen Sie ein Zeitreihendiagramm hinzu, um die Prognoseergebnisse des trainierten Modells zu visualisieren.

Bildschirmfoto 2022-10-19 um 17.19.19.png

Fazit

Vertex AI ist eine vereinfachte, nicht kodierende Hochgeschwindigkeitslösung zum Speichern und Organisieren von Machine-Learning-Aufgaben mit weniger komplizierten Eingabedaten. Der Datensatz kann direkt aus dem Cloud-Data Warehouse BigQuery verwendet werden, und wir können sogar das AutoML-Skript sofort in anspruchsvollem BigQueryML ausführen. Im kommenden Blogbeitrag dieser Serie werden wir mehr über die überwältigenden Funktionen von BigQueryML erfahren und darüber, wie ML-Modelle mithilfe von Standard-SQL-Abfragen erstellt werden.

Weitere Links

Folge uns auf LinkedIn für Einblicke in unsere tägliche Arbeit und wichtige Updates zu BigQuery, Data Studio und Marketing Analytics.

Abonniere unseren YouTube-Kanal für Diskussionen zu DWH, BigQuery, Looker Studio und Google Tag Manager.

Wenn Sie BigQuery von Grund auf lernen möchten, erhalten Sie Zugriff auf unsere kostenloser BigQuery-Kurs

Verbessern Sie Ihre Fähigkeiten mit Google Data Studio und BigQuery, indem Sie sich für unser Udemy-Kurs.

Benötigen Sie Hilfe bei der Einrichtung eines modernen, kostengünstigen Data Warehouse oder eines analytischen Dashboards? Senden Sie uns eine E-Mail an hello@datadice.io um einen Anruf zu vereinbaren.