Speak AI CLI — Transkribieren, Analysieren & Suchen von Ihrem Terminal
Die Speak AI CLI gibt Ihnen 26 Befehle für Transkription, NLP-Analyse, Medienverwaltung und AI-Chat direkt von Ihrem Terminal aus. Jeder Befehl unterstützt --json zum Scripting und Piping.
Installieren Sie in einem Befehl
Die CLI wird mit demselben npm-Paket wie der MCP-Server ausgeliefert. Installieren Sie global, führen Sie den Init-Wizard aus und beginnen Sie sofort mit allen 26 Befehlen.
npm install -g @speakai/mcp-server
# Initialisieren und legen Sie Ihren API-Schlüssel fest
speakai-mcp init
Also available as an official Claude Code plugin
Speak AI is listed in the official Claude Code marketplace. Install without leaving Claude Code:
/plugin install speakai@claude-plugins-official
Dann ausführen /reload-plugins and follow the getting-started skill to connect your API key.
26 Befehle in 3 Kategorien
Laden Sie hoch, transkribieren Sie, analysieren Sie, durchsuchen Sie, organisieren Sie und exportieren Sie Medien von Ihrem Terminal. Jeder Befehl unterstützt --json Ausgabe zum Weiterleiten an andere Tools.
11 Befehle
Medienverwaltung
hochladen, list-media, get-transcript, get-insights, Status, exportieren, aktualisieren, löschen, Favoriten, Untertitel, Erneut analysieren. Laden Sie lokale Dateien oder URLs hoch, rufen Sie Transkripte und NLP-Insights ab, exportieren Sie in beliebigen Formaten und verwalten Sie Ihre gesamte Medienbibliothek.
3 Befehle
AI und Suche
fragen ermöglicht es Ihnen, jedes Medium, jeden Ordner oder Ihren gesamten Workspace mit AI abzufragen. chat-history listet frühere AI Chat-Gespräche auf. suchen führt eine Volltextsuche über alle Transkripte und Insights durch. Piping Ergebnisse zu jq, grep oder Ihren eigenen Scripts.
12 Befehle
Organisation und Automatisierung
list-folders, create-folder, clips, clip, Statistiken, Sprachen, Besprechung planen, create-text, config, init. Organisieren Sie Dateien in Ordnern, erstellen Sie Highlight-Clips, planen Sie Meeting-Bots und verwalten Sie Konfigurationen.
Echte Befehle, echte Arbeitsabläufe
Sechs Befehle, die zeigen, was die CLI kann. Laden Sie Aufzeichnungen hoch, rufen Sie Transkripte ab, fragen Sie mit AI ab, durchsuchen Sie Ihre Mediathek, exportieren Sie zu PDF und leiten Sie JSON-Ausgabe an andere Tools weiter.
speakai-mcp hochladen ./interview.mp3 -n “Q1-Interview” –warten
# Abrufen von Klartexttranskript und Speicherung in Datei
speakai-mcp Transkript abc123 –plain > meeting.txt
# Fragen Sie AI nach einer bestimmten Aufnahme
speakai-mcp fragen “Was waren die Maßnahmen?” -m abc123
# Alle Abschriften aus diesem Jahr durchsuchen
speakai-mcp suchen “Bedenken bezüglich Preisgestaltung” –ab 2026-01-01
# Als PDF mit Sprechernamen exportieren
speakai-mcp exportieren abc123 -f pdf –speakers
# Videos als JSON auflisten und an jq weiterleiten
speakai-mcp ls –type video –json | jq ‘.mediaList[].name’
Entwickelt für Automatisierung und Skalierung
Die CLI verwandelt Speak AI in eine scriptbare Media-Intelligence-Engine. So nutzen Teams sie.
Batch-Transkription
Laden Sie einen ganzen Ordner mit Aufnahmen hoch und verarbeiten Sie diese über Nacht. Verwenden Sie eine Shell-Schleife mit upload --wait um Hunderte von Dateien sequenziell oder parallel zu transkribieren. Rufen Sie Transkripte und Insights ab, wenn die Verarbeitung abgeschlossen ist.
CI/CD-Integration
Fügen Sie Transkriptions- und Analyseschritte zu Ihrer Build-Pipeline hinzu. Transkribieren Sie Produktdemo-Aufzeichnungen bei jedem Release. Führen Sie NLP-Analyse für Kundenanruf-Aufzeichnungen als Teil Ihrer Daten-Pipeline aus. Alle Ausgaben sind JSON-nativ.
Forschungs-Workflows
Durchsuchen Sie Hunderte von Interviews mit suchen. Stellen Sie Fragen zu Ihrer gesamten Bibliothek mit fragen. Exportieren Sie Ergebnisse als PDF oder CSV. Erstellen Sie reproduzierbare Research-Pipelines, die von einem einzigen Skript aus laufen.
Automatisierte Berichterstellung
Richten Sie Cron-Jobs ein, um wöchentliche Meeting-Zusammenfassungen abzurufen. Verwenden Sie Statistiken um Workspace-Aktivitäten zu verfolgen. Piping JSON-Output zu Python-Scripts, die benutzerdefinierte Reports und Dashboards für Ihr Team generieren.
Was die Speak AI CLI tut und für wen sie bestimmt ist
Die Speak AI CLI ist eine Befehlszeilenschnittstelle, die Entwicklern, Forschern und Power-Usern direkten Terminalzugriff auf die vollständige Sprechen Sie AI Plattform. Anstatt Dateien über einen Web-Browser hochzuladen, Dashboards zu durchsuchen und durch Menüs zu klicken, führen Sie einen einzigen Befehl aus. Laden Sie eine Aufzeichnung hoch, erhalten Sie ein Transkript, durchsuchen Sie Ihre Mediathek, stellen Sie AI-Fragen zu Ihren Daten und exportieren Sie Ergebnisse in jedem Format. Alles von Ihrem Terminal aus, alles skriptierbar, alles mit JSON-Ausgabe zum Weiterleiten an andere Tools.
Die CLI wird als Teil von @speakai/mcp-server npm-Paket. Installieren Sie es global mit npm install -g @speakai/mcp-server, ausführen speakai-mcp init um Ihren API-Schlüssel zu setzen, und Sie haben 26 Befehle einsatzbereit. Das gleiche Paket enthält auch MCP Server with 83 tools for AI assistants like Claude, ChatGPT, Cursor, and Windsurf. Both the CLI and MCP server share the same API key and access the same workspace data.
Wie sich die CLI von der Weboberfläche unterscheidet
Die Speak AI Web-Oberfläche unter app.speakai.co ist für interaktive Nutzung konzipiert: Durchsuchen Sie Ihre Mediathek, spielen Sie Aufzeichnungen ab, lesen Sie Transkripte und erkunden Sie Erkenntnisse visuell. Die CLI ist für Automatisierung und Effizienz konzipiert. Sie eignet sich hervorragend für Batch-Operationen, Scripting und Integration mit anderen Tools. Laden Sie 200 Dateien in einer Schleife hoch. Durchsuchen Sie Ihre gesamte Mediathek und leiten Sie Ergebnisse an grep weiter. Exportieren Sie jede Aufzeichnung in einem Ordner als PDF. Diese Workflows sind über eine Web-Oberfläche entweder unpraktisch oder unmöglich, aber über die Befehlszeile unkompliziert.
Jeder Befehl unterstützt --json Output, was die Integration mit jq, Python, Node.js oder jedem anderen Tool in Ihrem Stack erleichtert. Die CLI unterstützt auch --plain Ausgabe für menschenlesbare Ergebnisse, wenn Sie interaktiv arbeiten. Sie können beide Ansätze kombinieren: Verwenden Sie die Web-Oberfläche für visuelle Exploration und die CLI für Automatisierung und Batch-Arbeit.
Wie die CLI mit dem MCP-Server zusammenhängt
Die CLI und die MCP Server are complementary tools packaged together. The MCP server provides 83 tools that AI assistants call during conversation. You describe what you want in natural language, and your AI assistant orchestrates the right tool calls. The CLI provides 26 commands that you invoke directly. You type the exact command, pass the exact arguments, and get deterministic results. Use the MCP server when you want your AI to figure out the workflow. Use the CLI when you already know exactly what you want to do and need it to happen the same way every time.
Sprachunterstützung und Transkription
Die CLI unterstützt Transkription in über 70 Sprachen mit automatischer Spracherkennung. Speaker Diarization identifiziert, wer was gesagt hat. Word-Level-Timestamps ermöglichen präzise Ausrichtung. Wenn Sie eine Datei hochladen mit speakai-mcp upload, transkribiert die Plattform automatisch und führt NLP-Analyse durch: Sentiment, Keywords, Themes und Named Entities. Sie können diese Ergebnisse abrufen mit get-transcript und get-insights, oder fragen Sie sie ab mit fragen mit AI Chat powered by Claude, Gemini oder GPT.
Skripterstellung und Automatisierungsbeispiele
Teams verwenden die CLI, um automatisierte Workflows zu erstellen, die über eine GUI unpraktisch wären. Ein Forschungsteam könnte ein Bash-Skript schreiben, das alle Interview-Aufzeichnungen von einem gemeinsamen Laufwerk hochlädt, auf die Verarbeitung wartet und dann in Transkripten nach bestimmten Themen sucht und die Ergebnisse als CSV exportiert. Ein DevOps-Team könnte einen Schritt in ihre CI/CD-Pipeline einfügen, der Produktdemo-Aufzeichnungen transkribiert und Zusammenfassungen an Slack pusht. Eine Beratungsfirma könnte einen Cron-Job jeden Montag ausführen, der die Besprechungsaufzeichnungen der vorherigen Woche abruft, Zusammenfassungen generiert via fragen, und sendet eine konsolidierte Zusammenfassung per E-Mail an das Team. Die --json Flag auf jedem Befehl bedeutet, dass sich die CLI sauber in jede Skriptsprache oder Automatisierungswerkzeug integriert.
Erste Schritte
Installieren Sie die CLI mit npm install -g @speakai/mcp-server. Ausführen speakai-mcp init um Ihren API-Schlüssel einzugeben. Probieren Sie dann speakai-mcp ls um Ihre Medienbibliothek zu sehen, speakai-mcp upload ./file.mp3 --wait um eine Aufnahme zu transkribieren, und speakai-mcp ask "Zusammenfassung dieser Aufnahme" um es mit AI abzufragen. Vollständige Dokumentation und Quellcode finden Sie unter GitHub. Die CLI ist kostenlos und Open Source unter der MIT-Lizenz. Sie benötigen ein Speak AI-Konto zur Authentifizierung. Vollständig API-Dokumentation ist unter docs.speakai.co. Siehe die Entwicklerseite für die vollständige Plattformintegration, einschließlich REST API, Webhooks, einbettbare Widgets und White-Label-Optionen.
Häufig gestellte Fragen
Wie installiere ich die Speak AI CLI?
Installieren Sie global von npm mit npm install -g @speakai/mcp-server. Führen Sie dann aus speakai-mcp init um Ihren API-Schlüssel zu setzen. Die CLI ist im gleichen Paket wie der MCP-Server enthalten. Sie benötigen Node.js 18 oder später. Das Paket ist kostenlos und Open Source unter der MIT-Lizenz. Sehen Sie es auf npm oder GitHub.
Was ist der Unterschied zwischen der CLI und dem MCP-Server?
The CLI provides 26 commands you run directly in your terminal. The MCP server provides 83 tools that AI assistants like Claude, ChatGPT, Cursor, and Windsurf call during conversation. Both ship in the same npm package and share the same API key. Use the CLI for scripting, automation, and deterministic workflows. Use the MCP server when you want your AI assistant to orchestrate complex, multi-step tasks through natural language.
Kann ich die CLI in Skripten und Automatisierung verwenden?
Ja. Jeder Befehl unterstützt --json Ausgabe zum Weiterleiten an andere Tools wie jq, Python-Skripte oder CI/CD-Pipelines. Sie können die CLI in Bash-Skripten, Cron-Jobs, Build-Pipelines und jedem Automatisierungs-Workflow verwenden. Häufige Muster sind Batch-Upload von Aufzeichnungsordnern, geplante Berichte und automatisierte Transkript-Exporte.
Welche Audio- und Videoformate unterstützt die CLI?
Die CLI unterstützt alle gängigen Audio- und Videoformate, einschließlich MP3, MP4, WAV, M4A, FLAC, OGG, WebM, MOV, AVI und MKV. Sie können lokale Dateien hochladen oder URLs bereitstellen. Die Plattform verarbeitet Formatkonvertierung und Verarbeitung automatisch. Es ist nicht erforderlich, Dateien vor dem Hochladen zu konvertieren.
Ist die CLI kostenlos?
Die CLI selbst ist kostenlos und Open Source unter der MIT-Lizenz. Sie benötigen ein Speak AI-Konto, um sich zu authentifizieren und die Befehle zu verwenden. API-Zugang ist auf allen kostenpflichtigen Plänen verfügbar, und Sie erhalten während der kostenlosen 7-tägigen Testversion vollen Zugriff ohne Kreditkarte erforderlich. Siehe Preisgestaltung für Plandetails.
Wie authentifiziere ich mich?
Registrieren Sie sich auf app.speakai.co und kopieren Sie Ihren API-Schlüssel von Kontoeinstellungen. Ausführen speakai-mcp config set-key oder speakai-mcp init um es lokal zu speichern. Der Schlüssel wird in Ihrem Benutzer-Konfigurationsverzeichnis gespeichert und für alle nachfolgenden Befehle verwendet. Sie können Ihren Schlüssel jederzeit aus den Kontoeinstellungen rotieren.
Beginnen Sie mit der Nutzung von Speak AI von Ihrem Terminal aus
26 Befehle für Transkription, NLP-Analyse, AI Chat und Medienverwaltung. Installation mit einem Befehl, scripting alles, piping JSON-Output überall hin.
Probieren Sie Speak Free
Erstellen Sie ein Konto, greifen Sie Ihren API-Schlüssel und starten Sie die Ausführung von Befehlen. Vollzugriff während der 7-Tage-Testversion. Keine Kreditkarte erforderlich.
Dokumentation anzeigen
Vollständige README mit Setup-Anleitung, Befehlsreferenz und Beispielen. Open Source unter MIT. Inspizieren Sie den Code, melden Sie Probleme und tragen Sie bei.
Transkribieren, analysieren und suchen Sie von Ihrem Terminal aus
Treten Sie 250.000+ Personen und Teams bei, die Speak AI verwenden. Installieren Sie die CLI und starten Sie die Ausführung von Befehlen in unter 2 Minuten.
So verwenden Sie die Speak AI CLI für Batch-Transkription
Die Speak AI CLI bringt Transkription und AI-Analyse in Ihr Terminal — nützlich für Batch-Verarbeitung, CI/CD-Integration, automatisierte Pipelines und Developer-Workflows, bei denen eine Web-Oberfläche Reibung verursacht. Installieren Sie die CLI, authentifizieren Sie sich mit Ihrem API-Schlüssel und beginnen Sie, Dateien von der Befehlszeile aus einzureichen.
Was die Speak AI CLI unterstützt
- Datei-Upload — Senden Sie Audio- und Videodateien direkt von der Befehlszeile zur Transkription ein
- URL-Einreichung — Transkribieren Sie YouTube, Vimeo, Loom oder jede öffentliche Audio-/Video-URL ohne vorheriges Herunterladen
- Stapelverarbeitung — Reihen Sie mehrere Dateien oder einen Ordner mit Aufnahmen zur gleichzeitigen Transkription ein
- Transkript-Abruf — Abrufen abgeschlossener Transkripte als TXT, JSON oder SRT direkt auf stdout oder eine lokale Datei
- CI/CD-Integration — Transkriptionsjobs als Teil automatisierter Build- oder Data-Pipelines ausführen
- Sprachspezifikation — legen Sie die Quellsprache pro Job fest oder verwenden Sie automatische Erkennung
Speak AI CLI FAQ
Wie installiere ich die Speak AI CLI?
Installation über npm: npm install -g @speakai/cli. Authentifizieren Sie sich mit Ihrem API-Schlüssel unter Verwendung von speakai auth. Vollständige Installation und Befehlsreferenz unter docs.speakai.co/cli.
Kann ich die Speak AI CLI verwenden, um einen Ordner mit Audiodateien stapelweise zu transkribieren?
Ja. Die CLI unterstützt Directory-Submission — zeigen Sie auf einen Ordner mit Aufzeichnungen und sie reiht alle Dateien für Batch-Transkription ein. Ergebnisse werden in Ihrem Workspace gespeichert und sind über die CLI verfügbar, wenn die Verarbeitung abgeschlossen ist.
Wie integriere ich die Speak AI CLI in eine CI/CD-Pipeline?
Fügen Sie die CLI zu Ihrer Pipeline-Umgebung hinzu, authentifizieren Sie sich via API-Schlüssel als Umgebungsvariable und rufen Sie auf speakai transcribe als Pipeline-Schritt. Webhook-Callbacks benachrichtigen Ihre Pipeline, wenn die Transkription für asynchrone Workflows abgeschlossen ist.
Installieren Sie die Speak AI CLI — erhalten Sie Ihren API-Schlüssel kostenlos, ohne Kreditkarte erforderlich.





