Proma v0.9.16
对比基准:v0.9.15
新功能
- 语音输入自定义热词实验 — 豆包流式语音输入新增本地自定义热词能力,可在「设置 → 语音输入」中按行或逗号填写产品名、技术词、人名等专有词 (#380)
- 请求级热词注入 — 启动识别时会把热词去重后直传给豆包 ASR 的
corpus.context.hotwords,无需先到火山控制台创建热词表 - 轻量词库配置 — 新增设置页多行输入控件,默认保存在本地配置中,适合作为热词识别效果的快速实验入口
- 安全兜底 — 读取旧配置或手动编辑过的配置时,对非字符串热词字段自动降级为空值,避免启动识别时报错
- 请求级热词注入 — 启动识别时会把热词去重后直传给豆包 ASR 的
Bug 修复
- 语音停顿后文本丢失修复 — 语音浮窗不再简单用最新 ASR 事件覆盖整段文本,会合并「已确认文本 + 当前分句」,避免用户自然停顿后前文被后续分句覆盖 (#380)
- 语音停顿容忍度提升 — 豆包 ASR 的
end_window_size从 800ms 调整为 5000ms,并补充force_to_speech_time,减少稍微停顿就被过早切句的问题 - Windows 缩放快捷键修复 — 修复 Windows 下主键盘
Ctrl++可能被上报为Ctrl+=导致无法放大的问题,并兼容小键盘加号 - Windows 顶部空间修正 — 左侧 Sidebar 不再沿用 macOS 红绿灯避让间距,Windows 下 Chat / Agent 模式切换区域更紧凑,减少顶部空白
- 关闭按钮遮挡修复 — 调整 Agent 侧栏文件区域与关闭按钮的层级和间距,避免窗口控制区与文件内容互相遮挡
界面与体验优化
- 语音识别跨停顿更自然 — 豆包返回全量文本或仅返回当前分句时,浮窗都会尽量保持一段完整、连续的听写结果
- 专有名词识别更可控 — 用户可以把项目名、框架名、英文缩写等直接加入热词输入框,用更低成本验证词库对识别准确率的改善
- Windows 侧栏布局优化 — Chat / Agent 模式切换高度提高,非 macOS 平台的侧栏顶部间距更贴合自定义标题栏
开发与打包
- 版本更新 —
@proma/electron从0.9.15升级到0.9.16 - Agent SDK 升级 —
@anthropic-ai/claude-agent-sdk及对应平台 optionalDependencies 从0.2.123升级到0.2.129 - 语音文本合并测试 — 新增
voice-text-normalizerBDD 风格测试,覆盖「停顿后返回当前分句」和「全量返回不重复拼接」两类场景 - 设置页基础组件 — 新增
SettingsTextarea,用于承载语音输入热词这类多行设置项
使用提示
- 如果语音输入经常把产品名、库名或人名识别错,可以在「设置 → 语音输入 → 自定义热词」中逐行添加,例如
Proma、Jotai、ShadcnUI - 自定义热词适合少量高频专有名词;如果需要大规模词表或强制替换词,后续仍可接入火山控制台的热词表 / 替换词表能力
- 本版本把语音停顿窗口放宽到 5 秒,适合听写时自然思考;再次按语音快捷键仍会立即停止并提交
下载
- macOS Apple Silicon —
Proma-0.9.16-arm64.dmg - macOS Intel —
Proma-0.9.16.dmg - Windows —
Proma-Setup-0.9.16.exe