Wie man GitHub nahtlos in Hugging Face integriert

📅
🕑 6 Minuten Lesezeit

Die Verbindung deines GitHub- Kontos mit Hugging Face klingt komplizierter, als sie tatsächlich ist – zumindest nach der anfänglichen Einrichtung. Wenn du mit ML-Modellen, Datensätzen arbeitest oder einfach nur Code synchronisierst, erleichtert es dir die Arbeit ungemein. Manuelles Hochladen von Dateien oder wiederholtes Kopieren von Code gehören der Vergangenheit an. Automatisierte Push-Vorgänge von GitHub direkt zu Hugging Face bedeuten weniger Fehler und einen reibungsloseren Workflow. Zugegeben, die Einrichtung der Integration kann beim ersten Mal etwas einschüchternd wirken, insbesondere wenn du dich mit Git, Tokens oder Workflows noch nicht so gut auskennst.

Diese Anleitung zerlegt den Prozess in überschaubare Schritte, sodass auch Anfänger alles problemlos verbinden können. Nach der Einrichtung wird jeder Commit, den Sie auf GitHub hochladen, Ihr Hugging Face-Repository automatisch aktualisieren. Wie von Zauberhand. Naja, fast. Nur ein paar Schritte, einige Berechtigungen und die Anpassung einiger Dateien – und schon kann es losgehen.

Wie man GitHub mit Hugging Face verbindet

Erstelle ein Repository auf Hugging Face

Zuerst müssen Sie einen Bereich für Ihren Code auf Hugging Face erstellen. Melden Sie sich in Ihrem Konto an und klicken Sie dann auf Neues Repository (normalerweise finden Sie die Schaltfläche direkt im Dashboard oder unter Ihrem Profilmenü).Wählen Sie den Typ entsprechend Ihrer Arbeit aus: Wenn es sich um ein Modell handelt, wählen Sie ein Modell-Repository ; wenn es sich um Datensätze oder Bereiche handelt, wählen Sie den entsprechenden Typ.

Wähle einen einprägsamen Namen, der idealerweise deinem GitHub-Repository ähnelt. Das vermeidet spätere Verwechslungen. Kopiere nach der Erstellung die Repository-URL – sie sieht etwa so aus: https://huggingface.co/dein-benutzername/dein-repo. Du benötigst sie für die Einrichtung.

Dieser Schritt legt im Grunde fest, wo Ihr Code platziert wird, daher ist er von entscheidender Bedeutung.

Generieren Sie Ihren Zugriffstoken für das Umarmungsgesicht.

Gehe zu deinen Hugging Face -Profileinstellungen und suche nach Zugriffstoken (diese findest du normalerweise im Kontomenü oder über dein Profilsymbol).Erstelle ein neues Token – nenne es beispielsweise „github-deploy“ – und stelle sicher, dass es Schreibberechtigung hat. So kann es Updates hochladen.

Kopieren Sie diesen Token sofort, denn nachdem Sie diese Seite verlassen haben, wird er Ihnen nicht mehr angezeigt. Er ist wie ein Passwort, also gehen Sie sorgsam damit um. Mit diesem Token kann GitHub Aktualisierungen an Ihr Hugging Face-Repository übertragen, ohne dass Sie ständig Passwörter eingeben müssen. Erstaunlich sicher – solange Sie ihn mit niemandem teilen.

Füge das Token zu den GitHub-Geheimnissen hinzu.

Öffne als Nächstes dein GitHub-Repository. Gehe zu „Einstellungen“, dann zu Geheimnisse und Variablen (normalerweise in der linken Seitenleiste) und klicke auf Aktionen. Erstelle ein neues Geheimnis namens HF_TOKEN und füge dort dein Hugging Face-Token ein.

Warum das Ganze? Weil Ihr Token dadurch verborgen und sicher bleibt. Wenn Sie ihn in Ihrem Code belassen, riskieren Sie Probleme. GitHub kann dieses Geheimnis stattdessen bei jeder Automatisierung referenzieren und so Ihre Zugangsdaten schützen.

Erstellen Sie das Workflow-Verzeichnis und die Datei deploy.yml.

In Ihrem GitHub-Repository benötigen Sie eine bestimmte Ordnerstruktur für die Automatisierung. Erstellen Sie daher den Ordnerpfad: .github/workflows/. Dies können Sie direkt auf GitHub tun, indem Sie auf „Datei hinzufügen“„Neue Datei erstellen“ klicken und anschließend den Pfad eingeben .github/workflows/deploy.yml. Hier befindet sich Ihr Bereitstellungsskript.

Fügen Sie anschließend ein YAML-Skript in diese Datei ein – das Skript, das GitHub mitteilt, was beim Übertragen von Änderungen geschehen soll. Sie können beispielsweise folgenden Code kopieren und einfügen, aber denken Sie daran, YOUR_USERNAME und YOUR_REPO_NAME durch Ihre tatsächlichen Daten zu ersetzen.

name: Deploy to Hugging Face on: push: branches: - main jobs: deploy: runs-on: ubuntu-latest steps: - name: Checkout Repository uses: actions/checkout@v3 - name: Push to Hugging Face env: HF_TOKEN: ${{ secrets. HF_TOKEN }} run: | git config --global user.email "[email protected]" git config --global user.name "your-username" git clone https://huggingface.co/YOUR_USERNAME/YOUR_REPO_NAME hf-repo rsync -av --exclude='.git'./ hf-repo/ cd hf-repo git add.git commit -m "Update from GitHub Actions" || echo "No changes to commit" git push https://YOUR_USERNAME:[email protected]/YOUR_USERNAME/YOUR_REPO_NAME  

Ersetzen Sie die Platzhalter durch Ihre tatsächlichen Daten. Entscheidend ist der Befehl `git clone` und das anschließende Pushen mit dem Token. Diese Konfiguration wird bei jedem Push in den Hauptzweig automatisch ausgeführt und automatisiert so Ihre Aktualisierungen.

Verstehen Sie, was hinter den Kulissen passiert.

Im Prinzip startet jeder Push in Ihren Hauptzweig diesen Workflow. Dabei wird Ihr Code ausgecheckt, das Hugging Face-Repository geklont, Ihre Dateien mit rsync kopiert, alle Änderungen committet und zurückgepusht. Es ist nicht garantiert, dass es beim ersten Mal fehlerfrei funktioniert – bei manchen Konfigurationen können Geheimnisse oder Berechtigungen Probleme verursachen –, aber sobald der Prozess läuft, werden Ihre Dateien fast sofort in Hugging Face angezeigt.

Automatisierung auslösen und Ergebnisse prüfen

Nachdem Sie alles gespeichert und die neue deploy.yml- Datei übertragen haben, versuchen Sie, eine Änderung zu übertragen. Beobachten Sie den Tab Aktionen – bei korrekter Konfiguration sollte der Vorgang erfolgreich abgeschlossen werden. Aktualisieren Sie anschließend Ihre Hugging Face-Repository-Seite; die Änderungen sollten nun sichtbar sein. Wenn alles korrekt funktioniert, ist die Integration aktiv und zukünftige Commits lösen automatische Aktualisierungen aus.

Wie kann man Code manuell übertragen?

Das funktioniert genauso wie das Hochladen auf GitHub. Nachdem Sie Ihre Änderungen lokal vorgenommen haben, führen Sie Folgendes aus:

git add.git commit -m "Your message" git push https://huggingface.co/YOUR_USERNAME/YOUR_REPO_NAME --set-upstream origin main

Sie müssen sich mit Ihrem Benutzernamen und dem Zugriffstoken als Passwort authentifizieren (wenn Sie dazu aufgefordert werden).Nicht so elegant wie eine Automatisierung, aber für schnelle Aktualisierungen ausreichend.

Häufig gestellte Fragen

Ist die Verbindung von GitHub mit Hugging Face wirklich notwendig?

Nein, das ist nicht zwingend notwendig, aber es erleichtert die Arbeit ungemein. Besonders bei regelmäßigen Updates oder größeren Projekten. Es ist wie ein Cloud-Assistent, der deinen Code synchronisiert.

Ja, Sie können bei Bedarf mehrere Repositories verknüpfen. Wiederholen Sie den Vorgang einfach für jedes Repository.

Welche Token-Berechtigungen soll ich festlegen?

Normalerweise reicht Schreibzugriff aus – das bedeutet, dass Daten abgerufen und übertragen werden können. Administratorrechte sind nur erforderlich, wenn Sie unternehmensweite Daten verwalten.

Ist die Verwendung meines Zugriffstokens sicher?

Ja – solange du es geheim hältst. Behandle es wie ein Passwort. Gib es nicht öffentlich bekannt und nutze GitHub Secrets, um es zu schützen. So kann es nur deine Automatisierung verwenden.

Benötigt man dafür Programmierkenntnisse?

Nicht viel, aber ein wenig Vertrautheit mit Git-Befehlen und YAML ist hilfreich. Sobald das eingerichtet ist, ist es recht einfach. Die Automatisierung übernimmt nach der Ersteinrichtung den Großteil der Arbeit.

Zusammenfassung

Die Verbindung von GitHub mit Hugging Face klappt nicht auf Anhieb – manche Schritte erfordern etwas Geduld oder Wiederholungen. Aber sobald es funktioniert, spart es enorm viel Zeit. Jeder neue Push wird automatisch hochgeladen, sodass Sie sich mehr auf die Entwicklung konzentrieren können, anstatt Dateien manuell zu kopieren.

Zusammenfassung

  • Erstelle ein Hugging Face-Repository und kopiere die URL
  • Generieren Sie ein Zugriffstoken mit Schreibberechtigung
  • Füge das Token als Geheimnis in GitHub hinzu.
  • Erstellen Sie eine Workflow-YAML-Datei im Ordner .github/workflows
  • Fügen Sie das Automatisierungsskript ein und passen Sie es mit Ihren Informationen an.
  • Gib dich darauf ein und warte, bis die Magie beginnt.

Schlussgedanken

Durch Anpassen der Berechtigungen, Überprüfen der Pfade und Sicherstellen, dass die Zugangsdaten korrekt sind, lässt sich das Problem meist beheben. Falls gar nichts passiert, sollten Sie die Aktionsprotokolle prüfen – manchmal reicht schon ein Tippfehler oder eine Netzwerkstörung, um die Automatisierung zu stoppen. Hoffentlich erspart diese Information jemandem eines Tages stundenlanges Kopieren und Einfügen.