+80 项设置每个细节,由你掌控
为你的工作流量身打造的语音输入引擎。深度可配置,开箱即用,在每个应用中都能运行。
嗨 Mehdi,我们能同步一下 Lang chain 集成吗?Super base 迁移已经完成,tee RPC 端点也接好了。Prizma 一直报错,所以我在 vercell 上重新部署,前面挂了 cloud flare。century 的告警现在能进到正确的频道。off zero 还需要 SAML 配置,之后 anthrop pick 才能审查。我们周五前发出去吧。
每个细节,由你掌控
为你的工作流量身打造的语音输入引擎。深度可配置,开箱即用,在每个应用中都能运行。
自定义词典
- 无限自定义词汇: 添加任意数量的专有名词、品牌名或行业术语。
- 从修正中自动学习: 编辑听写的单词后,它会自动添加到词典中。
- 智能过滤: 只学习拼写修正,忽略不相关的重写。
片段库
- 语音触发的快捷方式: 说出关键词,它会被内联替换为完整内容。
- 模板和签名: 签名、跟进消息、地址、样板文本。
- 模糊匹配: 近似匹配会自动被识别并展开。
多语言听写
- 90 多种语言: 几乎可以用任何语言听写,无需附加组件。
- 听写中切换: 在同一会话中说多种语言。自由切换,无需停止或重新配置。
- 实时自动检测: 说话时自动检测您的语言。将检测限制为自定义列表,或允许全部 90 多种。
音频预处理
- 噪音过滤: 清除背景噪音,让模型只听到您的声音。
- 静音移除: 暂停多久都可以。静音会被裁剪,模型不会幻想出没说的词。
- 音量归一化: 无论您说话轻还是响,识别都保持一致。
- 成本和延迟优化: 发送前加速和压缩音频。使用您自己的 API 密钥时延迟更低、成本更低。
内置翻译
- 任意到任意: 用任何语言说话,输出到任何其他语言。无限制。
- 回退目标: 设置一次性翻译后回到的默认语言。
- 保留原文: 禁用翻译并保持听写语言不变。
格式模板
- 自定义指令: 定义每个模板的功能:语法、语气或输出格式。
- 按应用默认: 为每个应用分配模板。Slack:休闲消息;ChatGPT 和 Claude:提示;Cursor:代码就绪文本。
- 听写中切换: 说话时用键盘快捷键随时切换模板。
- 启用和禁用: 开关各个模板而不丢失其配置。
按应用定制
- 自动检测活动应用: 切换应用时设置自动切换。
- 按应用预设: 为每个应用配置听写语言、输出语言和清理模板。
- 即时覆盖: 听写过程中修改任何预设而不停止。启用或禁用预设而不删除它们。
云端与本地模式
- 云端、本地和自动: 云端追求速度,本地保护隐私,自动模式即时切换。
- 本地永久免费: 本地模型永远无限运行。不需要账户,没有上限。产品从不阻止您。
- 托管云选项: $5/月无限听写,14 天免费试用。开始无需信用卡。
- 自带密钥: 使用您自己的 API 密钥与支持的提供商,或接入自定义端点。无限使用,无额外费用。
- 独立的提供商: 分别设置听写和格式化的提供商。自由混合云端和本地。
定制化听写流程
- 点按、按住或免提: 按住说话或切换开/关。自定义触发键或组合。
- 小部件可见性和位置: 始终可见、隐藏或调用时显示。拖动、固定或跟随光标。
- 音频控制: 听写声音、系统音频静音和自动超时。全部可配置。
- 剪贴板支持: 在粘贴之外,将输出复制到剪贴板。
- 实时控制: 用快捷键在听写中切换模板、语言或设置。
完全数据隐私
- 一切本地: 模型、设置、词典、片段、模板、偏好。全部存储在您的机器上。
- 零数据保留: 我们什么都不存。没有音频、没有听写、没有偏好。只有在您创建账户时的认证凭证。
- 无需账户: 无需注册即可使用应用。只有托管云代理需要账户。
- 本地数据控制: 配置音频保留期限,或随时擦除所有应用数据。
- 默认关闭分析: 使用分析默认禁用。只有您选择时才加入。