Handy: 一个注重隐私的离线语音转文本工具,可将转录文本直接粘贴到任何活动文本框中

Handy: 一个注重隐私的离线语音转文本工具,可将转录文本直接粘贴到任何活动文本框中

它解决了什么问题

Handy 是一个注重隐私的、开源的语音转文本应用程序,允许用户将口头语言直接转录到计算机上的任何活动文本框中。它消除了对基于云端的转录服务的需求,确保音频数据保留在本地并保持私密。

工作原理

用户可以通过可配置的键盘快捷键或按键通话(push-to-talk)模式触发转录。该应用程序通过 Silero 使用语音活动检测(VAD)来过滤静音,然后使用本地 ML 模型处理音频。它支持多种模型选项,包括各种尺寸的 Whisper 模型(带有 GPU 加速)和用于自动语言检测的 CPU 优化的 Parakeet V3 模型。

适用人群

它专为寻求免费、私密且可扩展的语音转文本工具的用户设计,该工具可在 Windows、macOS 和 Linux 上完全离线工作。

亮点

  • 完全本地化:所有处理都在用户的机器上进行,没有云端数据传输。
  • 跨平台:原生支持 Windows、macOS 和 Linux。
  • 灵活的模型支持:支持 Whisper (Small, Medium, Turbo, Large) 和 Parakeet V3 模型。
  • 可扩展性:作为 Tauri 应用程序构建(Rust 后端,React 前端)并设计为易于 fork 的形式。
  • 系统集成:在 macOS 上与 Raycast 集成,并支持用于远程控制的 CLI flags。

Sources