Speak AI CLI — Transcribir, Analizar & Buscar desde Tu Terminal
La CLI de Speak AI te proporciona 26 comandos para transcripción, análisis NLP, gestión de medios y chat de AI directamente desde tu terminal. Cada comando soporta --json para secuencias de comandos y canalización.
Instalar en un solo comando
El CLI se distribuye con el mismo paquete npm que el servidor MCP. Instala globalmente, ejecuta el asistente de inicialización y comienza a usar los 26 comandos inmediatamente.
npm install -g @speakai/mcp-server
# Inicializa y establece tu clave API
speakai-mcp init
Also available as an official Claude Code plugin
Speak AI is listed in the official Claude Code marketplace. Install without leaving Claude Code:
/plugin install speakai@claude-plugins-official
Luego ejecuta /reload-plugins and follow the getting-started skill to connect your API key.
26 comandos en 3 categorías
Carga, transcribe, analiza, busca, organiza y exporta medios desde tu terminal. Cada comando es compatible con --json salida para canalizar a otras herramientas.
11 comandos
Gestión de medios de comunicación
cargar, list-media, get-transcript, get-insights, estado, exportar, actualizar, eliminar, favoritos, subtítulos, reanalizarCarga archivos locales o URLs, extrae transcripciones e insights de NLP, exporta en cualquier formato y gestiona toda tu biblioteca de medios.
3 comandos
AI y búsqueda
preguntar te permite consultar cualquier medio, carpeta o tu espacio de trabajo completo con AI. chat-history enumera conversaciones anteriores con IA. buscar realiza búsqueda de texto completo en todas las transcripciones e insights. Envía resultados a jq, grep o tus propios scripts.
12 comandos
Organización y Automatización
list-folders, create-folder, clips, clip, estadísticas, idiomas, programar-reunión, create-text, configuración, initOrganiza archivos en carpetas, crea clips destacados, programa bots de reuniones y gestiona la configuración.
Comandos reales, flujos de trabajo reales
Seis comandos que muestran lo que la CLI puede hacer. Carga grabaciones, extrae transcripciones, consulta con AI, busca en tu biblioteca, exporta a PDF y canaliza salida JSON a otras herramientas.
speakai-mcp cargar ./interview.mp3 -n “Entrevista Q1” –esperar
# Obtener transcripción en texto plano y guardar en archivo
speakai-mcp transcripción abc123 –plain > meeting.txt
# Pregúntale a la IA sobre una grabación específica
speakai-mcp preguntar “¿Cuáles fueron los elementos de acción?” -m abc123
# Buscar todas las transcripciones de este año
speakai-mcp buscar “preocupaciones de precios” –desde 2026-01-01
# Exportar como PDF con nombres de participantes
speakai-mcp exportar abc123 -f pdf –speakers
# Enumerar videos como JSON y canalizar a jq
speakai-mcp ls –type video –json | jq ‘.mediaList[].name’
Construido para automatización y escala
La CLI convierte Speak AI en un motor de inteligencia de medios programable. Así es cómo los equipos la utilizan.
Transcripción por lotes
Carga una carpeta completa de grabaciones y procésalas durante la noche. Usa un bucle de shell con upload --wait para transcribir cientos de archivos secuencialmente o en paralelo. Extrae transcripciones e insights cuando se complete el procesamiento.
Integración CI/CD
Añade pasos de transcripción y análisis a tu pipeline de compilación. Transcriba grabaciones de demostración de productos en cada lanzamiento. Ejecuta análisis NLP en grabaciones de llamadas de clientes como parte de tu pipeline de datos. Toda la salida es JSON nativa.
Flujos de trabajo de investigación
Busca entre cientos de entrevistas con buscar. Haz preguntas en toda tu biblioteca con preguntarExporta hallazgos como PDF o CSV. Construye pipelines de investigación reproducibles que se ejecuten desde un único script.
Informes automatizados
Configura trabajos cron para extraer resúmenes semanales de reuniones. Usa estadísticas para rastrear la actividad del espacio de trabajo. Envía salida JSON a scripts de Python que generen reportes personalizados y dashboards para tu equipo.
Qué hace la CLI de Speak AI y para quién es
Speak AI CLI es una interfaz de línea de comandos que otorga a desarrolladores, investigadores y usuarios avanzados acceso directo desde terminal a la plataforma completa Habla AI plataforma. En lugar de cargar archivos a través de un navegador web, navegar por paneles y hacer clic en menús, ejecutas un único comando. Carga una grabación, obtén una transcripción, busca en tu biblioteca, haz preguntas de AI sobre tus datos y exporta resultados en cualquier formato. Todo desde tu terminal, todo programable, todo con salida JSON para canalizar a otras herramientas.
La CLI se distribuye como parte de @speakai/mcp-server paquete npm. Instálalo globalmente con npm install -g @speakai/mcp-server, ejecutar speakai-mcp init para establecer tu clave API y tienes 26 comandos listos para usar. El mismo paquete también incluye el Servidor MCP with 83 tools for AI assistants like Claude, ChatGPT, Cursor, and Windsurf. Both the CLI and MCP server share the same API key and access the same workspace data.
Cómo la CLI difiere de la interfaz web
La interfaz web de Speak AI en app.speakai.co está diseñado para uso interactivo: navega por tu biblioteca, reproduce grabaciones, lee transcripciones y explora perspectivas visualmente. La CLI está diseñada para automatización y eficiencia. Destaca en operaciones por lotes, scripting e integración con otras herramientas. Carga 200 archivos en un bucle. Busca en toda tu biblioteca y canaliza resultados a grep. Exporta cada grabación en una carpeta como PDF. Estos flujos de trabajo son impracticables o imposibles a través de una interfaz web pero directos desde la línea de comandos.
Cada comando admite --json salida, lo que facilita la integración con jq, Python, Node.js o cualquier otra herramienta en tu stack. El CLI también es compatible con --plain salida para resultados legibles por humanos cuando estás trabajando interactivamente. Puedes mezclar ambos enfoques: usa la interfaz web para exploración visual y la CLI para automatización y trabajo por lotes.
Cómo la CLI se relaciona con el servidor MCP
La CLI y la Servidor MCP are complementary tools packaged together. The MCP server provides 83 tools that AI assistants call during conversation. You describe what you want in natural language, and your AI assistant orchestrates the right tool calls. The CLI provides 26 commands that you invoke directly. You type the exact command, pass the exact arguments, and get deterministic results. Use the MCP server when you want your AI to figure out the workflow. Use the CLI when you already know exactly what you want to do and need it to happen the same way every time.
Compatibilidad de idiomas y transcripción
La CLI soporta transcripción en más de 70 idiomas con detección automática de idioma. La diarización de altavoces identifica quién dijo qué. Las marcas de tiempo a nivel de palabra permiten alineación precisa. Cuando cargas un archivo con speakai-mcp uploadla plataforma lo transcriba automáticamente y ejecute análisis NLP: sentimiento, palabras clave, temas y entidades nombradas. Puedes recuperar estos resultados con get-transcript y get-insights, o consúltelos con preguntar usando AI Chat impulsado por Claude, Gemini o GPT.
Ejemplos de scripting y automatización
Los equipos utilizan la CLI para crear flujos de trabajo automatizados que serían impracticables a través de una GUI. Un equipo de investigación podría escribir un script de bash que carga todas las grabaciones de entrevistas de una unidad compartida, espera el procesamiento y luego busca en las transcripciones temas específicos y exporta los resultados como CSV. Un equipo de DevOps podría añadir un paso a su pipeline CI/CD que transcriba grabaciones de demostraciones de productos e impulse resúmenes a Slack. Una firma de consultoría podría ejecutar un trabajo cron cada lunes que extraiga las grabaciones de reuniones de la semana anterior y genere resúmenes a través de preguntar, y envía un resumen consolidado por correo electrónico al equipo. El --json flag en cada comando significa que el CLI se integra limpiamente en cualquier lenguaje de scripting o herramienta de automatización.
Primeros pasos
Instale el CLI con npm install -g @speakai/mcp-server. Ejecutar speakai-mcp init para ingresar tu clave API. Luego intenta speakai-mcp ls para ver su biblioteca de medios, speakai-mcp upload ./file.mp3 --wait para transcribir una grabación, y speakai-mcp ask "Summarize this recording" para consultarlo con AI. La documentación completa y el código fuente están en GitHubEl CLI es gratuito y código abierto bajo la licencia MIT. Necesitas una cuenta de Speak AI para autenticarte. Acceso completo Documentación de la API está en docs.speakai.co. Consulte la página de desarrolladores para la historia completa de integración de la plataforma, incluyendo la API REST, webhooks, widgets incrustables y opciones de etiqueta blanca.
Preguntas frecuentes
¿Cómo instalo la CLI de Speak AI?
Instala globalmente desde npm con npm install -g @speakai/mcp-server. Luego ejecuta speakai-mcp init para establecer tu clave API. La CLI se incluye en el mismo paquete que el servidor MCP. Necesitas Node.js 18 o posterior. El paquete es gratuito y de código abierto bajo la licencia MIT. Vélo en npm o GitHub.
¿Cuál es la diferencia entre la CLI y el servidor MCP?
The CLI provides 26 commands you run directly in your terminal. The MCP server provides 83 tools that AI assistants like Claude, ChatGPT, Cursor, and Windsurf call during conversation. Both ship in the same npm package and share the same API key. Use the CLI for scripting, automation, and deterministic workflows. Use the MCP server when you want your AI assistant to orchestrate complex, multi-step tasks through natural language.
¿Puedo usar la CLI en scripts y automatización?
Sí. Cada comando admite --json salida para canalizar a otras herramientas como jq, scripts de Python o pipelines CI/CD. Puedes usar la CLI en scripts de bash, trabajos cron, pipelines de compilación y cualquier flujo de trabajo de automatización. Los patrones comunes incluyen carga por lotes de carpetas de grabaciones, informes programados y exportaciones de transcripciones automatizadas.
¿Qué formatos de audio y video admite la CLI?
La CLI soporta todos los formatos principales de audio y video incluyendo MP3, MP4, WAV, M4A, FLAC, OGG, WebM, MOV, AVI y MKV. Puedes cargar archivos locales o proporcionar URLs. La plataforma maneja la conversión de formato y el procesamiento automáticamente. No hay necesidad de preconvertir archivos antes de cargar.
¿Es la CLI gratuita?
La CLI en sí es gratuita y de código abierto bajo la licencia MIT. Necesitas una cuenta de Speak AI para autenticarte y usar los comandos. El acceso API está disponible en todos los planes pagos y obtienes acceso completo durante la prueba gratuita de 7 días sin tarjeta de crédito requerida. Ver precios para detalles del plan.
¿Cómo me auténtico?
Regístrate en app.speakai.co y copia tu clave API desde configuración de cuenta. Ejecutar speakai-mcp config set-key o speakai-mcp init para almacenarlo localmente. La clave se guarda en tu directorio de configuración de usuario y se usa para todos los comandos posteriores. Puedes rotar tu clave en cualquier momento desde la configuración de cuenta.
Comienza a usar Speak AI desde tu terminal
26 comandos para transcripción, análisis de NLP, AI Chat, y gestión de medios. Instala en un comando, automatiza scripts, envía salida JSON a cualquier lugar.
Pruebe Speak Free
Crea una cuenta, obtén tu clave API y comienza a ejecutar comandos. Acceso completo durante la prueba gratuita de 7 días. No se requiere tarjeta de crédito.
Ver Documentación
README completo con guía de configuración, referencia de comandos y ejemplos. Código abierto bajo MIT. Inspecciona el código, reporta problemas y contribuye.
Transcribe, analiza y busca desde tu terminal
Únete a 250,000+ personas y equipos usando Speak AI. Instala el CLI y comienza a ejecutar comandos en menos de 2 minutos.
Cómo usar la CLI de Speak AI para Transcripción por Lotes
La CLI de Speak AI lleva la transcripción y el análisis de AI a tu terminal — útil para procesamiento por lotes, integración CI/CD, pipelines automatizados y flujos de trabajo de desarrollador donde una interfaz web añade fricción. Instala la CLI, autentica con tu clave API y comienza a enviar archivos desde la línea de comandos.
Lo que la CLI de Speak AI admite
- Carga de archivos — enviar archivos de audio y video para transcripción directamente desde la línea de comandos
- Envío de URL — transcribir YouTube, Vimeo, Loom o cualquier URL de audio/video pública sin descargar primero
- Procesamiento por lotes — encolar múltiples archivos o un directorio de grabaciones para transcripción simultánea
- Recuperación de transcripciones — obtener transcripciones completadas como TXT, JSON o SRT directamente en stdout o un archivo local
- Integración CI/CD — ejecutar trabajos de transcripción como parte de canalizaciones de compilación o datos automatizadas
- Especificación de idioma — establece el idioma de origen por trabajo o utiliza detección automática
Speak AI CLI FAQ
¿Cómo instalo la CLI de Speak AI?
Instalar a través de npm: npm install -g @speakai/cli. Auténticate con tu clave API usando speakai auth. Instalación completa y referencia de comandos en docs.speakai.co/cli.
¿Puedo usar la CLI de Speak AI para transcribir por lotes una carpeta de archivos de audio?
Sí. La CLI soporta envío de directorio — apúntala a una carpeta de grabaciones y pone en cola todos los archivos para transcripción por lotes. Los resultados se guardan en tu espacio de trabajo y se pueden recuperar a través de la CLI cuando el procesamiento se completa.
¿Cómo integro la CLI de Speak AI en una canalización CI/CD?
Añade el CLI a tu entorno de pipeline, autentica usando clave API como variable de entorno y llama speakai transcribe como paso de pipeline. Las devoluciones de llamada de webhook notifican a tu pipeline cuando se completa la transcripción para flujos de trabajo asincronos.
Instala la CLI de Speak AI — obtén tu clave API gratis, sin tarjeta de crédito requerida.





