Preguntas frecuentes
Respuestas breves y honestas. Si falta algo, abra una incidencia en GitHub.
№ 01 ¿Qué navegadores funcionan?
Cualquier cosa basada en Chromium: Chrome, Edge, Brave, Arc, Vivaldi, Opera. Safari aún no admite getDisplayMedia con audio de manera confiable. Firefox puede capturar la pantalla, pero la compatibilidad con audio es limitada: Chromium es el punto óptimo.
№ 02 ¿Por qué mi Mac solo captura audio de pestañas, no Zoom o Spotify?
Los navegadores macOS solo pueden capturar audio desde el interior de una pestaña del navegador. Para capturar audio de todo el sistema (Zoom, Spotify, Skype, etc.), instale BlackHole (dispositivo de audio virtual gratuito y de código abierto) y enrute el audio de la aplicación a través de él. En Windows y Linux, esto "simplemente funciona" mediante la pantalla compartida.
№ 03 ¿Cómo obtengo una clave API de Groq?
Vaya a console.groq.com, regístrese (el inicio de sesión de Google funciona), luego visite /keys y cree una clave. Tarda unos 60 segundos. El nivel gratuito le ofrece aproximadamente 8 horas de transcripción por día por clave.
№ 04 ¿Mi audio se envía a su servidor?
No. No hay servidor. La aplicación es un paquete HTML/JS estático en Cloudflare Pages. Los fragmentos de audio van desde su navegador directamente a la API de Groq. El texto traducido va desde su navegador directamente a Google/Microsoft/DeepL/MyMemory. No tenemos registros, ni análisis en la página /app, ni opción de exclusión porque no hay nada que cancelar.
№ 05 ¿Qué tan privado es realmente?
Tan privado como confías en tu navegador y en Groq. Su clave Groq se encuentra en localStorage. Sus transcripciones se encuentran en el almacenamiento local. No se almacena nada en nuestra infraestructura porque no tenemos ninguna infraestructura más allá de servir archivos estáticos.
№ 06 ¿Qué idiomas admite?
Reconocimiento de voz: todos los idiomas que admite Whisper Large v3 (~100). Traducción entre cualquiera de: inglés, vietnamita, chino, japonés, coreano, francés, español, alemán, ruso, árabe, hindi, tailandés, indonesio, portugués y más a través del respaldo de Google.
№ 07 ¿Qué tan precisa es la traducción?
El punto final gratuito de Google es sólido para las conversaciones cotidianas. Para contenido técnico, legal o médico, conecte una clave API de DeepL (nivel gratuito de 500 000 caracteres/mes): la diferencia es notable.
№ 08 ¿Puedo exportar la transcripción?
Sí. El panel de transcripción tiene botones Copiar, Descargar .txt y Descargar .srt. El archivo .srt se puede cargar como pista de subtítulos en VLC, mpv o YouTube.
№ 09 ¿Volverá la aplicación de escritorio?
Existe una compilación de escritorio Tauri separada para usuarios avanzados que desean aceleración de GPU + susurro.cpp sin conexión. La versión web cubre el 95% de los casos de uso sin necesidad de instalación.
№ 10 ¿Por qué no existe un plan pago?
Porque no hay ningún servidor por el que pagar. Servimos archivos estáticos en el nivel gratuito de Cloudflare. No le paga nada a Groq en el nivel gratuito, ni centavos si va más allá. Agregar una capa paga significaría agregar un backend, lo que anularía la historia de la privacidad.