Grundlegendes zur BigQuery WHERE-Anweisung

August 23, 2024
Kapitel 2: Die BigQuery WHERE-Anweisung verstehen

Die WHERE-Anweisung verstehen

Die WHERE-Anweisung in SQL, einschließlich BigQuery, ermöglicht es Ihnen, Zeilen auf der Grundlage bestimmter Bedingungen zu filtern. Es dient als leistungsstarkes Tool zum Extrahieren relevanter Daten aus großen Datensätzen.
Schauen wir uns einige Beispielaussagen an, um ihre Verwendung zu veranschaulichen:
Einzelheiten zu dem in diesen Beispielen verwendeten Datensatz finden Sie in Kapitel Eins.
Lassen Sie uns zunächst eine Beispielanweisung ohne WHERE-Anweisung ausführen.

WÄHLEN SIE Name, Kapazität

VON „bigquery-public-data.san_franciso_bikeshare_station_info“

Das Ergebnis zeigt eine Liste mit verschiedenen Stationsnamen und den entsprechenden Kapazitäten an. Außerdem beträgt die Gesamtzahl der Zeilen 472.

Grundlegende BigQuery-Abfrage

Fügen wir nun die WHERE-Klausel hinzu als Kapazität > 15

WÄHLEN SIE Name, Kapazität

VON „bigquery-public-data.san_franciso_bikeshare_station_info“

WO Kapazität > 15

In diesem Beispiel filtern wir Zeilen, in denen die Kapazität größer als 15 ist. Daher werden nur Stationen mit einer Kapazität von mehr als 15 angezeigt. Die Anzahl der Zeilen hat sich verringert, sodass insgesamt 390 Zeilen übrig sind.

BigQuery-Ergebnis nach Verwendung der WHERE-Anweisung

2. Filterung nach String-Werten

Lassen Sie uns unsere Tabelle filtern, wobei der Stationsname „Otis St at Brady St“ lautet

WÄHLEN SIE Name, Kapazität

VON „bigquery-public-data.san_franciso_bikeshare_station_info“

WO Name = 'Otis St in Brady St'

Dieses Ergebnis zeigt eine Tabelle mit Zeilen an, die auf dem Stationsnamen 'Otis St at Brady St' basieren

Hinweis:
Achten Sie beim Hinzufügen einer WHERE-Bedingung als Zeichenfolge darauf, den Wert in einfache Anführungszeichen zu setzen, und denken Sie daran, dass bei den Werten zwischen Groß- und Kleinschreibung unterschieden wird.

Abfrageergebnis nach Verwendung des Zeichenkettenfilters in der WHERE-Anweisung

3. Kombinieren mehrerer Bedingungen mit dem Operator „ODER“

Wenn Sie Ihre Tabelle mit mehreren unterschiedlichen Werten filtern möchten, können Sie den Operator „ODER“ verwenden, um dies zu erreichen.

WÄHLEN SIE Name, Kapazität

VON „bigquery-public-data.san_franciso_bikeshare_station_info“

WO Name = 'Otis St in Brady St'

ODER Name = 'Filbert St in Fillmore St'

ODER Name = 'Fillmore St in Jefferson St'

ODER Name = 'Turk Blvd an der Stanyan St'

BigQuery-Ergebnis nach Verwendung mehrerer Bedingungen mit dem Operator „OR“

4. Verwenden des IN-Operators

Anstatt den OR-Operator zu verwenden, können Sie dasselbe Ergebnis effizienter erzielen, indem Sie den IN-Operator verwenden. Dieser Ansatz führt zu einer kürzeren und überschaubareren Aussage.

WÄHLEN SIE Name, Kapazität

VON „bigquery-public-data.san_franciso_bikeshare_station_info“

WO IST DER NAME? („Otis St an der Brady St“, „Filbert St an der Fillmore St“, „Fillmore St an der Jefferson St“, „Turk Blvd an der Stanyan St“)

Der IN-Operator bietet eine präzisere Möglichkeit, mehrere Bedingungen anzugeben, wodurch dasselbe Ergebnis wie im vorherigen Beispiel erzielt wird.

Ergebnis mit IN-Operator abfragen

5. Nach Datum filtern

Als Nächstes können Sie Ihre Abfrage auch anhand von Daten filtern. Wenn Sie beispielsweise nur Zeilen wünschen, in denen das Ereignis nach dem 20. April 2028 eingetreten ist, können Sie diese Abfrage verwenden. Außerdem verwenden wir hier eine andere Tabelle im Bikeshare-Datensatz - bikeshare_trips.

WÄHLEN SIE Name, Kapazität

VON „bigquery-public-data.san_franciso_bikeshare_trips“

WO start_date > '20.04.2018'

BigQuery-Ergebnis unter Verwendung des Datumsfilters mit WHERE-Anweisung

5. Erweiterte Filterung mit mehreren Bedingungen

Hier filtern wir Zeilen sowohl nach dem Datumsbereich als auch nach der bestellten Mindestproduktmenge.

WÄHLEN SIE Name, Kapazität

VON „bigquery-public-data.san_franciso_bikeshare_trips“

WO: start_date ZWISCHEN '2018-04-20' UND '2023-04-30'

UND product_quantity_ordered >= 10;

Bewährte Verfahren und Tipps:

  • Beachten Sie immer die Reihenfolge der Bedingungen in komplexen WHERE-Klauseln, um eine genaue Filterung zu gewährleisten.
  • Wenn Sie nach Spalten filtern, die nicht in der SELECT-Anweisung enthalten sind, ist es ratsam, diese Spalten einzubeziehen, um die Übersichtlichkeit der Analyse zu gewährleisten.
  • Experimentieren Sie mit verschiedenen Filtertechniken, um die Abfrageleistung zu optimieren und die gewünschten Ergebnisse zu erzielen.

Fazit

Die Beherrschung der Datenfilterung in BigQuery eröffnet eine Vielzahl von Möglichkeiten für die Datenanalyse und -erkundung. Indem Sie die Macht der WHERE-Anweisung nutzen und bewährte Methoden anwenden, können Sie effizient wertvolle Erkenntnisse aus Ihren Datensätzen extrahieren. Ganz gleich, ob Sie nach numerischen Werten, Zeichenkettenwerten, Datumsangaben filtern oder mehrere Bedingungen kombinieren, wenn Sie diese Techniken verstehen, können Sie fundierte Entscheidungen auf der Grundlage Ihrer Daten treffen.

Darüber hinaus haben wir auch ein YouTube-Tutorial zum gleichen Thema, in dem wir weitere Beispiele für die WHERE-Anweisung vorstellen. Wenn du ein visueller Lerner bist (oder nicht), dann musst du dir unsere ansehen YouTube-Video.

Springe zu Kapitel 3.

Abonnieren Sie unseren Newsletter
Danke! Deine Einreichung ist eingegangen!
Hoppla! Beim Absenden des Formulars ist etwas schief gelaufen.