+80 项设置

每个细节,由你掌控

为你的工作流量身打造的语音输入引擎。深度可配置,开箱即用,在每个应用中都能运行。

已将 Maddie 修正为 Mehdi
Mehdi,我们能同步一下 Lang chain 集成吗?Super base 迁移已经完成,tee RPC 端点也接好了。Prizma 一直报错,所以我在 vercell 上重新部署,前面挂了 cloud flarecentury 的告警现在能进到正确的频道。off zero 还需要 SAML 配置,之后 anthrop pick 才能审查。我们周五前发出去吧。
无限自定义词汇

添加任意数量的专有名词、品牌名或行业术语。

从修正中自动学习

编辑听写的单词后,它会自动添加到词典中。

智能过滤

只学习拼写修正,忽略不相关的重写。

每个细节,由你掌控

为你的工作流量身打造的语音输入引擎。深度可配置,开箱即用,在每个应用中都能运行。

自定义词典

  • 无限自定义词汇: 添加任意数量的专有名词、品牌名或行业术语。
  • 从修正中自动学习: 编辑听写的单词后,它会自动添加到词典中。
  • 智能过滤: 只学习拼写修正,忽略不相关的重写。

片段库

  • 语音触发的快捷方式: 说出关键词,它会被内联替换为完整内容。
  • 模板和签名: 签名、跟进消息、地址、样板文本。
  • 模糊匹配: 近似匹配会自动被识别并展开。

多语言听写

  • 90 多种语言: 几乎可以用任何语言听写,无需附加组件。
  • 听写中切换: 在同一会话中说多种语言。自由切换,无需停止或重新配置。
  • 实时自动检测: 说话时自动检测您的语言。将检测限制为自定义列表,或允许全部 90 多种。

音频预处理

  • 噪音过滤: 清除背景噪音,让模型只听到您的声音。
  • 静音移除: 暂停多久都可以。静音会被裁剪,模型不会幻想出没说的词。
  • 音量归一化: 无论您说话轻还是响,识别都保持一致。
  • 成本和延迟优化: 发送前加速和压缩音频。使用您自己的 API 密钥时延迟更低、成本更低。

内置翻译

  • 任意到任意: 用任何语言说话,输出到任何其他语言。无限制。
  • 回退目标: 设置一次性翻译后回到的默认语言。
  • 保留原文: 禁用翻译并保持听写语言不变。

格式模板

  • 自定义指令: 定义每个模板的功能:语法、语气或输出格式。
  • 按应用默认: 为每个应用分配模板。Slack:休闲消息;ChatGPT 和 Claude:提示;Cursor:代码就绪文本。
  • 听写中切换: 说话时用键盘快捷键随时切换模板。
  • 启用和禁用: 开关各个模板而不丢失其配置。

按应用定制

  • 自动检测活动应用: 切换应用时设置自动切换。
  • 按应用预设: 为每个应用配置听写语言、输出语言和清理模板。
  • 即时覆盖: 听写过程中修改任何预设而不停止。启用或禁用预设而不删除它们。

云端与本地模式

  • 云端、本地和自动: 云端追求速度,本地保护隐私,自动模式即时切换。
  • 本地永久免费: 本地模型永远无限运行。不需要账户,没有上限。产品从不阻止您。
  • 托管云选项: $5/月无限听写,14 天免费试用。开始无需信用卡。
  • 自带密钥: 使用您自己的 API 密钥与支持的提供商,或接入自定义端点。无限使用,无额外费用。
  • 独立的提供商: 分别设置听写和格式化的提供商。自由混合云端和本地。

定制化听写流程

  • 点按、按住或免提: 按住说话或切换开/关。自定义触发键或组合。
  • 小部件可见性和位置: 始终可见、隐藏或调用时显示。拖动、固定或跟随光标。
  • 音频控制: 听写声音、系统音频静音和自动超时。全部可配置。
  • 剪贴板支持: 在粘贴之外,将输出复制到剪贴板。
  • 实时控制: 用快捷键在听写中切换模板、语言或设置。

完全数据隐私

  • 一切本地: 模型、设置、词典、片段、模板、偏好。全部存储在您的机器上。
  • 零数据保留: 我们什么都不存。没有音频、没有听写、没有偏好。只有在您创建账户时的认证凭证。
  • 无需账户: 无需注册即可使用应用。只有托管云代理需要账户。
  • 本地数据控制: 配置音频保留期限,或随时擦除所有应用数据。
  • 默认关闭分析: 使用分析默认禁用。只有您选择时才加入。