声忆 – AI 语音输入法,支持本地 ASR 离线识别
声忆是什么
声忆是专为 macOS 打造的语音输入法,主打”说得比打字快”。按住右 Option 说话,松开后仅需 1.4 秒即可将语音转为文字并自动插入光标处,支持中英混输与本地 ASR 离线识别。内置可搜索、可导出的记忆层,让每句话自动归档;提供 AI 智能整理与中文排版引擎,在本地毫秒级修正标点、空格和品牌名大小写。所有数据留存本机,隐私优先,基础功能永久免费,Pro 版解锁云端无限识别。

声忆的主要功能
-
快捷语音输入(L1 / SPEAK):按住右 Option(或 Fn / 右 ⌘)说话,松开后 1.4 秒成文并自动插入当前光标位置。支持中英混输、同音字和口头禅后台处理,无需切换窗口。
-
AI 智能整理:可选接入豆包 / DeepSeek / Kimi / OpenAI 等 LLM,仅修复同音字、删口头禅、加标点,不篡改原意;confidence < 0.5 时保留原文。双击右 Option 可临时跳过 AI。
-
记忆与回顾(L2 / RECALL):每句话自动归档到本地,记录应用来源、时间、标签,支持全文搜索、过滤和导出(Markdown / JSON / CSV)。
-
智能层洞察(L3 / REFLECT):基于 Big5 等模型生成周画像、MBTI 分析和金句提取,7 个视角点评你的一周。
-
中文排版引擎:本地规则处理空格、标点、大小写、品牌名自动修正(如”Cursor”不再变”苦色”),参照 pangu.js、GB/T 15834-2011 等标准,全部 < 5 ms 完成,零网络调用。
-
AI 翻译 + 对照:支持 50+ 语言,菜单栏一键切换「整理 / 翻译 / 对照」模式。
-
学习闭环:你每次编辑 AI 的修正,自动提取为候选规则,菜单栏一键采纳。
-
目标窗口锁定:录音时锁定当前 App,切窗口不插错,fallback 到剪贴板 + toast。
如何使用声忆
- 下载安装:前往声忆的官网 https://voiceinput.app/zh/,下载 DMG(22.6 MB),支持 macOS 14.0+ 的 Apple Silicon 与 Intel Mac,非 App Store 分发,Sparkle 自动更新。
-
首次授权:首次启动时按引导页一次性授予麦克风、输入监控、辅助功能三项权限,授权后点击一键重启即可立即生效。
-
语音输入:按住右 Option(或 Fn / 右 ⌘)开始说话,松开后 1.4 秒内文字自动插入当前光标位置,中英混输、同音字和口头禅由后台自动处理。
-
配置 AI 整理(可选):在设置中填入 OpenAI 兼容 API Key(支持 DeepSeek / Kimi / OpenAI / 本地服务),即可启用智能纠错、删口头禅和加标点功能,月费约 ¥5–20。
-
使用翻译/对照模式:在菜单栏一键切换「整理 / 翻译 / 对照」模式,支持 50+ 语言实时翻译或原文译文并排输出。
-
查看记忆与回顾:每句话自动归档到本地记忆层,按 App、时间、标签分类,支持全文搜索、过滤,以及 Markdown / JSON / CSV 一键导出。
-
获取智能洞察:智能层基于 Big5 模型自动生成周画像、MBTI 分析和金句提取,帮你回顾一周的表达与思考。
-
训练个人规则:编辑 AI 修正结果后,系统会自动提取为候选规则,在菜单栏一键采纳,形成越用越准的学习闭环。
-
临时跳过 AI:双击右 Option 可临时跳过 AI 整理,直接输出原始语音识别结果。
-
数据迁移:将数据库文件拷贝到新 Mac 的相同路径,即可完整迁移所有历史记录与配置。
声忆的核心优势
-
中文场景速度领先:1.4 秒成文,对比 TypeLess / Wispr Flow 等竞品的 3–10 秒优势明显
-
不只是输入法:每句话沉淀为可搜索的记忆层,具备数据回顾和智能洞察能力
-
隐私优先:所有语音和文字写入 App 专属本地目录,启动前自动备份;API Key 存系统 Keychain,卸载即可带走全部数据
-
轻量无负担:DMG 仅 22.6 MB,macOS 14.0+ 即可运行,Apple Silicon 与 Intel 通用
声忆的同类竞品对比
| 对比维度 | 声忆(VoiceInput) | TypeLess | Wispr Flow |
|---|---|---|---|
| 产品定位 | macOS 语音输入法 + 本地记忆层 | 跨平台 AI 语音听写工具 | 跨平台 AI 语音输入层 |
| 支持平台 | macOS 14.0+(Apple / Intel) | macOS、Windows、iOS、Android | macOS、Windows、iOS、Android |
| 中文速度 | 1.4 秒成文,中文场景优化 | 约 220 wpm,云端处理 | 约 184 wpm,云端 AI 重写 |
| 定价模式 | 免费本地版 / 自带 Key $0 / Pro $9/月或$49一次性 | 免费 2,000–8,000 词/周 / Pro $12/月(年付)或$30/月 | 免费 2,000 词/周 / Pro $15/月 / Team $12/人/月 |
| 离线能力 | ✅ 三套本地 ASR 完全离线 | ❌ 云端处理,无离线模式 | ❌ 云端 AI,需联网 |
| 记忆回顾 | ✅ L2 数据层归档 + L3 智能洞察(MBTI/周画像) | ⚠️ 本地历史记录,无智能分析 | ⚠️ 仪表盘统计 + 语音笔记 |
| 隐私策略 | 100% 本地,数据不离机,Keychain 存密钥 | 零数据保留,本地历史,不上传训练 | 隐私模式,内容云端处理后不留存 |
| 中文排版 | ✅ 本地引擎 <5ms,pangu.js/GB/T 15834 标准 | ❌ 通用 AI 清理,无中文排版专项 | ❌ 通用 AI 重写,无中文排版专项 |
| 核心差异 | 每句话沉淀为可搜索记忆层,不只是输入 | 跨平台最广,AI 自动编辑 + 语调适配 | 实时编辑( mid-sentence 改口),长会话支持 |
声忆的应用场景
-
日常高效文字输入:在聊天软件、邮件、社交媒体中按住快捷键说话,1.4 秒成文自动插入,比键盘打字更快,尤其适合长句表达和快速回复。
-
写作与内容创作:撰写文章、博客、笔记时语音输入灵感,AI 自动清理口头禅和修正同音字,中文排版引擎自动处理标点空格,让创作者专注于思路而非格式。
-
编程与开发工作:快速输入代码注释、技术文档、API 设计说明,内置 200+ 开发热词(如 Cursor、Kimi、DeepSeek)自动识别,避免专有名词被误转。
-
会议与访谈记录:实时语音转文字记录会议内容,每句话自动归档到本地记忆层,支持按应用和时间搜索回顾,方便后续整理会议纪要。
-
翻译与跨语言沟通:开启翻译或对照模式,说话直接输出 50+ 语言的译文,或原文与译文并排显示,适合跨国协作和多语言内容生产。
-
个人知识管理与日记:用记忆层沉淀日常表达,通过全文搜索找回曾经的想法,智能层自动生成周画像和金句提取,帮助回顾个人成长轨迹。
©️版权声明:若无特殊声明,本站所有文章版权均归AI工具集原创和所有,未经许可,任何个人、媒体、网站、团体不得转载、抄袭或以其他方式复制发表本站内容,或在非我站所属的服务器上建立镜像。否则,我站将依法保留追究相关法律责任的权利。
粤公网安备 123456789号