CHAPTER 02

常见问题

简短而诚实的答案。如果缺少某些内容,请在 GitHub 上提出问题。

№ 01 哪些浏览器可以工作?

任何基于 Chromium 的东西:Chrome、Edge、Brave、Arc、Vivaldi、Opera。 Safari 尚不可靠地支持带有音频的 getDisplayMedia。 Firefox 可以捕获屏幕,但音频支持有限——Chromium 是最佳选择。

№ 02 为什么我的 Mac 只捕获标签音频,而不捕获 Zoom 或 Spotify?

macOS 浏览器只能从浏览器选项卡内部捕获音频。要捕获系统范围的音频(Zoom、Spotify、Skype 等),请安装 BlackHole(免费、开源虚拟音频设备)并通过它路由应用程序的音频。在 Windows 和 Linux 上,这可以通过屏幕共享“正常工作”。

№ 03 如何获取 Groq API 密钥?

访问 console.groq.com,注册(Google 登录有效),然后访问 /keys 并创建密钥。大约需要 60 秒。免费套餐为您提供每个密钥每天约 8 小时的转录时间。

№ 04 我的音频发送到你们的服务器了吗?

不,没有服务器。该应用程序是 Cloudflare Pages 上的静态 HTML/JS 捆绑包。音频块从您的浏览器直接进入 Groq 的 API。翻译后的文本从您的浏览器直接发送到 Google / Microsoft / DeepL / MyMemory。我们没有日志,/app 页面上没有分析,没有选择退出切换,因为没有什么可以选择退出。

№ 05 它到底有多私密?

就像您信任您的浏览器和 Groq 一样私密。您的 Groq 密钥位于 localStorage 中。您的成绩单位于本地存储中。我们的基础设施上没有存储任何内容,因为除了提供静态文件之外,我们没有任何基础设施。

№ 06 它支持哪些语言?

语音识别:Whisper Large v3 支持的每种语言(~100)。英语、越南语、中文、日语、韩语、法语、西班牙语、德语、俄语、阿拉伯语、印地语、泰语、印度尼西亚语、葡萄牙语之间的翻译,以及更多通过 Google 回退的翻译。

№ 07 翻译的准确性如何?

谷歌的免费端点非常适合日常对话。对于技术、法律或医疗内容,插入 DeepL API 密钥(免费套餐 500k 字符/月)——差异是显而易见的。

№ 08 我可以导出成绩单吗?

是的。转录面板具有“复制”、“下载 .txt”和“下载 .srt”按钮。 .srt 文件可以作为 VLC、mpv 或 YouTube 中的字幕轨道加载。

№ 09 桌面应用程序会回来吗?

为想要离线 Whisper.cpp + GPU 加速的高级用户提供了单独的 Tauri 桌面版本。网络版本涵盖 95% 的用例,无需任何安装。

№ 10 为什么没有付费计划?

因为没有服务器要付费。我们在 Cloudflare 的免费套餐上提供静态文件。在免费套餐中,您无需向 Groq 支付任何费用,如果超出免费套餐,则无需支付几分钱。添加付费层意味着添加后端,这将破坏隐私故事。