Durch Anklicken „Akzeptieren“, stimmen Sie der Speicherung von Cookies auf Ihrem Gerät zu, um die Seitennavigation zu verbessern, die Nutzung der Website zu analysieren und unsere Marketingaktivitäten zu unterstützen. Sehen Sie sich unsere an Datenschutzrichtlinie für weitere Informationen.
Sep 4, 2024
More

Sind Git und Github dasselbe?

Wichtige Git-Befehle für Datenanalysten. Von Fassil S. Yehuala

Damit ein Unternehmen bei der Entscheidungsfindung von den Daten profitieren kann, müssen die Daten verarbeitet und analysiert werden. Dieser Prozess erfordert jedoch die Beteiligung mehrerer Personen, darunter Dateningenieure, Datenwissenschaftler und Datenanalysten. Tools wie Dataform bringen Best Practices für die Softwareentwicklung in die Datenentwicklungsbranche ein und ermöglichen es Datenteams, zusammenzuarbeiten und sich auch mit Remote-Entwicklungsumgebungen wie GitHub zu verbinden.

Die Beherrschung von Versionskontrolltools ist daher eine wichtige Fähigkeit für Datenexperten. In diesem Artikel wird erklärt, warum Git und GitHub hilfreich sind und wie sie funktionieren. Die Unterschiede zwischen diesen beiden Tools werden ebenfalls erörtert.

Was sind Git und GitHub?

Lassen Sie uns zunächst zurückgehen und über die Geschichte von Git und GitHub nachdenken. Wie bei jeder außergewöhnlichen Revolution entstand Git als Lösung für ein Problem. Wenn mehrere Entwickler an derselben Codebasis arbeiteten, war es schwierig, den Überblick über Änderungen zu behalten. Dieses Problem wurde 2005 mit der Entwicklung von Git gelöst, sodass Entwickler Änderungen einfach nachverfolgen, Fehler rückgängig machen und gemeinsam an Projekten arbeiten konnten.

GitHub wurde 2008 gegründet und wurde schnell zur weltweit beliebtesten Code-Hosting-Site. Microsoft hat es 2018 übernommen.

Projektmanagement-Tools wie Git und GitHub sind robuste Lösungen zur Versionskontrolle, mit denen Teams an Datenprojekten zusammenarbeiten können. Git stellt sicher, dass alle mit derselben Codeversion arbeiten, während GitHub eine zugängliche Projektmanagement- und Kommunikationsplattform bietet. Der Zweck dieser Tools besteht darin, verschiedenen Personen, die an demselben Projekt arbeiten, den Zugriff auf dieselben Informationen zu ermöglichen. Die Mitarbeiter können somit sehen, welche Änderungen an den verschiedenen Versionen des Projekts vorgenommen wurden, welche Aufgaben abgeschlossen wurden und was noch zu tun ist.

Mit Git arbeiten

Lassen Sie uns damit beginnen, die grundlegenden Befehle von Git zu erkunden.

Git installieren

Git kann einfach installiert werden, indem Sie die neueste Version von der offizielle Website.

Je nachdem, welches Betriebssystem Sie verwenden, müssen Sie die Installationsanweisungen befolgen. Sobald die Installation abgeschlossen ist, können Sie überprüfen, ob die Installation erfolgreich war, indem Sie Folgendes eingeben git --version in einem Terminal.

git --version

Git einrichten

Das erste, was Sie nach der Installation von Git tun müssen, macht eine kleine Einstellung. Zu Beginn benötigen Sie einen Benutzernamen und eine E-Mail-Adresse. Um dies zu erreichen, müssen Sie den ausführen Git-Konfiguration Befehl, da Sie damit Git-Konfigurationsvariablen ändern können.

Mit dem --global Mit dieser Option können Sie die Standardoptionen so anpassen, dass für jedes Git-Projekt derselbe Benutzername und dieselbe E-Mail-Adresse verwendet werden.

Fangen wir mit den folgenden Befehlen an:

<Your Name>git config --global user.name "“
git config --global user.email <Your email>

Mit dem folgenden Befehl erfahren Sie, ob die Änderungen korrekt vorgenommen wurden.

git config --list

Starte ein Git-Repository

Lassen Sie uns jetzt einen Ordner für das Projekt erstellen, an dem wir arbeiten werden.

mkdir mein_projekt

Um eine Git-Einzahlung zu starten, kannst du entweder ein vorhandenes Projekt oder Verzeichnis in Git importieren oder ein vorhandenes Git-Repository auf einem anderen Server klonen. Sehen wir uns diese beiden Methoden nacheinander an.

Initialisierung eines Git-Repositorys in einem bestehenden Verzeichnis

Um ein bestehendes Projekt in Git zu importieren, positioniere dich im Projektverzeichnis:

cd mein_projekt

Und dann tippe:

git init

Durch die Initialisierung eines Git-Repositorys wird ein Verzeichnis mit dem Namen erstellt .git das enthält alle für das Repository notwendigen Dateien.

Um zu überprüfen, ob .git Ordner ist da, geben Sie den folgenden Befehl ein:

ls -al

Ein vorhandenes Repository klonen

Wenn Sie stattdessen eine Kopie des Projekts wünschen, verwenden Sie Git-Klon. Wenn sich das Repository auf einem anderen Server befindet, muss der folgende Befehl ausgeführt werden:

Git-Klon <repository>

Und wenn sich das Repository auf Ihrem lokalen Server befindet, müssen Sie diesen Befehl eingeben:

Git-Klon <path>

Wenn du den Git-Klon Mit diesem Befehl erhält Git eine vollständige Kopie der Projektdaten, einschließlich aller Dateiversionen.

Änderungen im Repository speichern

Wenn du Änderungen an deinem Repository vornimmst, validierst du diese Änderungen.

Sie sollten wissen, dass sich jede Datei in einem Projekt in einem von zwei Zuständen befinden kann: verfolgt oder nicht verfolgt.

Eine Datei hat eine verfolgt Zustand beim Speichern in der Datenbank. Und jede ungespeicherte Datei wird nicht verfolgt. Eine getrackte Datei kann drei Status haben: Geändert (geändert); Indexiert (bereitgestellt); Validiert (bestätigt).

Git validiert alle Dateien in einem Projekt, wenn ein Git-Repository von einem lokalen Repository aus gestartet wird. Eine Datei ist gültig, wenn sie in der lokalen Datenbank gespeichert wird.

In der Zwischenzeit können Sie während der Arbeit an dem Projekt einige Dateien ändern oder neue hinzufügen. Git betrachtet geänderte Dateien als geändert und neu erstellte Dateien als nicht verfolgt. Wenn die geänderte oder hinzugefügte Datei Teil des Git-Repositorys ist, ist sie indiziert.

Neue Dateien hinzufügen

Stellen Sie sich vor, Sie haben einen Python-Code geschrieben und ihn im mein_projekt Ordner, den du gerade erstellt hast als test.py. Durch Tippen ls im Terminal können Sie überprüfen, ob sich die Datei im Verzeichnis befindet. Sobald Sie bestätigt haben, dass sich die Datei im Verzeichnis befindet, können Sie den Dateistatus überprüfen mit Git-Status.

Git-Status

Um die Datei zum Repository hinzuzufügen, verwende den Befehl git add. Sie können Dateien zum Index hinzufügen mit git hinzufügen <file> Befehl. Zum Beispiel, um hinzuzufügen test.py in das lokale Repository müssen Sie Folgendes eingeben:

git füge test.py hinzu

Wenn Sie Änderungen an vielen Dateien vorgenommen haben und sie alle auf einmal hinzufügen möchten, können Sie einen der folgenden Befehle verwenden.

git add --all
git hinzufügen.

Wenn du den Status deines Repositorys überprüfst, kannst du die neu hinzugefügten Dateien sehen. Dann kannst du die Datei übergeben mit Git-Commit. Fügen Sie beim Bestätigen eine Nachricht hinzu, in der die vorgenommenen Änderungen beschrieben werden.

git commit -m „Nachricht“

Um den Commit-Verlauf für das aktuelle Repository einzusehen, kannst du den folgenden Befehl verwenden:

Git-Protokoll

Mit Git-Branches arbeiten

Branches sind separate Versionen deines Haupt-Repositorys, die unabhängig voneinander verwaltet werden. Durch Branching kannst du an verschiedenen Teilen eines Projekts arbeiten, ohne dass dies Auswirkungen auf den Haupt-Branch hat. Lassen Sie uns nun Ihren ersten Branch mit dem folgenden Befehl erstellen:

Git-Zweig my_new_branch

Neben dem Master finden Sie Ihren neu geschaffenen Zweig. Bisher hast du an der Hauptniederlassung gearbeitet. Wenn Sie jedoch zu Ihrem Branch wechseln möchten, geben Sie den folgenden Befehl ein:

git checkout my_new_branch

Alternativ können Sie den Befehl verwenden git checkout -b meine_neue_Filiale um sofort einen neuen Zweig zu erstellen und zu diesem zu wechseln.

Sie befinden sich jetzt in dem Zweig, den Sie erstellt haben. Angenommen, Sie haben einige Notizen geschrieben und sie in Ihrem Arbeitsverzeichnis gespeichert als test.txt. Wie Sie dem Status von my_new_branch entnehmen können, befindet sich test.txt unter Dateien, die nicht verfolgt werden, da sie noch nicht hinzugefügt und festgeschrieben wurde.

git füge test.txt hinzu
git commit -m „Die Testdatei wurde hinzugefügt“

Sie haben jetzt eine Datei mehr auf Ihrem my_new_branch als auf dem Master. Sie müssen die neu erstellte Textdatei auf my_new_branch mit der zusammenführen Meister. Auf diese Weise werden die Änderungen, die Sie an der Filiale vorgenommen haben, Teil des Masters.

Git Checkout Master
git merge my_new_branch

Da master und my_new_branch jetzt identisch geworden sind, können Sie my_new_branch mit dem folgenden Befehl entfernen.

git branch -d mein_neue_Filiale

Verbinde Git mit GitHub

Um mit Git und GitHub zu beginnen, musst du zuerst ein Konto auf github.com erstellen. Danach melde dich an und erstelle dein erstes GitHub-Repository. Stellen Sie sicher, dass Sie dieselbe E-Mail-Adresse verwenden, die Sie in der Git-Konfiguration verwendet haben.

Auf GitHub siehst du den gleichen Prozess des Hinzufügens und Übernehmens von Dateien wie in einem Git-Repository, das auf deinem Computer gestartet wurde. Du kannst GitHub jedoch verwenden, um deine Änderungen an den GitHub-Hosting-Dienst zu übertragen. Dies ermöglicht es anderen, an demselben Projekt zusammenzuarbeiten. Sie können Änderungen von GitHub auf ihre Computer übertragen und ihre Änderungen auf GitHub übertragen.

Im Folgenden zeige ich die Befehle, die Sie benötigen, um Git auf GitHub zu verwenden. Da du ein Git-Repository auf deinem Computer eingerichtet hast, lass uns sehen, wie du es auf GitHub übertragen kannst:

git remote Herkunft hinzufügen <url>

Der obige Befehl gibt an, dass Sie ein Remote-Repository mit der angegebenen URL als Ursprung zu Ihrem lokalen Git-Repo hinzufügen. Mit dem folgenden Befehl kannst du deinen Master-Branch auf die Ursprungs-URL übertragen und ihn als Standard-Remote-Branch festlegen:

git push --set -upstream origin master

Wenn Sie zu GitHub zurückkehren, werden Sie feststellen, dass alles, was Sie bisher getan haben, auf GitHub übertragen wurde.

Falls ein anderes Teammitglied an deinem Repository arbeitet, kannst du die neuesten Änderungen abrufen, indem du den folgenden Befehl ausführst:

Git Pull

Fazit

Herzlichen Glückwunsch! Da du jetzt ein Verständnis von Git und GitHub hast, ermutige ich dich, weiter zu forschen! Wie man so schön sagt: Übung macht den Meister, also probiere Git-Befehle aus, um dich mit ihnen vertraut zu machen. Im Folgenden sind einige wichtige Befehle mit kurzen Beschreibungen aufgeführt.

Command Description
git config -list Returns a list of information about your git configuration
git config --global user.name "User Name" Configures your user name
git config --global user.email "Email" Configures your email
git init Creates a new local repository
git status Checks changed files in the working directory
git add . Add all files in your project to the staging area
git add "file" Adds a file to the staging area
git commit -m "message" Commits changes with message
git log Shows the commit history for the current repository
git branch Returns a list of all branches and marks the current branch with an asterisk and highlights it in green
git branch "branch_name" Creates a branch called "branch_name"
git checkout "branch_name" Switch to the "branch_name"
git checkout -b "branch_name" Creates "branch_name" in Git and switchs to it automaticaly
git branch -d "branch_name" Deletes "branch_name"
git merge "branch_name" Merges the history of the current branch with the "branch_name"
git remote add origin "url" Adds a remote repository to your local repository
git push Pushs changes to a remote repo
git pull Pulls changes from a remote repo

Weitere Links

Folge uns auf LinkedIn für Einblicke in unsere tägliche Arbeit und wichtige Updates zu BigQuery, Data Studio und Marketing Analytics.

Abonniere unseren YouTube-Kanal für Diskussionen zu DWH, BigQuery, Looker Studio und Google Tag Manager.

Wenn Sie BigQuery von Grund auf lernen möchten, erhalten Sie Zugriff auf unsere kostenloser BigQuery-Kurs

Verbessern Sie Ihre Fähigkeiten mit Google Data Studio und BigQuery, indem Sie sich für unser Udemy-Kurs.

Benötigen Sie Hilfe bei der Einrichtung eines modernen, kostengünstigen Data Warehouse oder eines analytischen Dashboards? Senden Sie uns eine E-Mail an hello@datadice.io um einen Anruf zu vereinbaren.