github ErlichLiu/Proma v0.9.16
0.9.16

latest releases: v0.9.18, v0.9.17
6 hours ago

Proma v0.9.16

对比基准:v0.9.15

新功能

  • 语音输入自定义热词实验 — 豆包流式语音输入新增本地自定义热词能力,可在「设置 → 语音输入」中按行或逗号填写产品名、技术词、人名等专有词 (#380)
    • 请求级热词注入 — 启动识别时会把热词去重后直传给豆包 ASR 的 corpus.context.hotwords,无需先到火山控制台创建热词表
    • 轻量词库配置 — 新增设置页多行输入控件,默认保存在本地配置中,适合作为热词识别效果的快速实验入口
    • 安全兜底 — 读取旧配置或手动编辑过的配置时,对非字符串热词字段自动降级为空值,避免启动识别时报错

Bug 修复

  • 语音停顿后文本丢失修复 — 语音浮窗不再简单用最新 ASR 事件覆盖整段文本,会合并「已确认文本 + 当前分句」,避免用户自然停顿后前文被后续分句覆盖 (#380)
  • 语音停顿容忍度提升 — 豆包 ASR 的 end_window_size 从 800ms 调整为 5000ms,并补充 force_to_speech_time,减少稍微停顿就被过早切句的问题
  • Windows 缩放快捷键修复 — 修复 Windows 下主键盘 Ctrl++ 可能被上报为 Ctrl+= 导致无法放大的问题,并兼容小键盘加号
  • Windows 顶部空间修正 — 左侧 Sidebar 不再沿用 macOS 红绿灯避让间距,Windows 下 Chat / Agent 模式切换区域更紧凑,减少顶部空白
  • 关闭按钮遮挡修复 — 调整 Agent 侧栏文件区域与关闭按钮的层级和间距,避免窗口控制区与文件内容互相遮挡

界面与体验优化

  • 语音识别跨停顿更自然 — 豆包返回全量文本或仅返回当前分句时,浮窗都会尽量保持一段完整、连续的听写结果
  • 专有名词识别更可控 — 用户可以把项目名、框架名、英文缩写等直接加入热词输入框,用更低成本验证词库对识别准确率的改善
  • Windows 侧栏布局优化 — Chat / Agent 模式切换高度提高,非 macOS 平台的侧栏顶部间距更贴合自定义标题栏

开发与打包

  • 版本更新@proma/electron0.9.15 升级到 0.9.16
  • Agent SDK 升级@anthropic-ai/claude-agent-sdk 及对应平台 optionalDependencies 从 0.2.123 升级到 0.2.129
  • 语音文本合并测试 — 新增 voice-text-normalizer BDD 风格测试,覆盖「停顿后返回当前分句」和「全量返回不重复拼接」两类场景
  • 设置页基础组件 — 新增 SettingsTextarea,用于承载语音输入热词这类多行设置项

使用提示

  • 如果语音输入经常把产品名、库名或人名识别错,可以在「设置 → 语音输入 → 自定义热词」中逐行添加,例如 PromaJotaiShadcnUI
  • 自定义热词适合少量高频专有名词;如果需要大规模词表或强制替换词,后续仍可接入火山控制台的热词表 / 替换词表能力
  • 本版本把语音停顿窗口放宽到 5 秒,适合听写时自然思考;再次按语音快捷键仍会立即停止并提交

下载

  • macOS Apple SiliconProma-0.9.16-arm64.dmg
  • macOS IntelProma-0.9.16.dmg
  • WindowsProma-Setup-0.9.16.exe

Don't miss a new Proma release

NewReleases is sending notifications on new releases.