voice-ui

🎙️ 实时自进化的语音 AI 助手

🥥61总安装量 20评分人数 15
100% 的用户推荐

基于 OpenAI 语音技术的自进化助手,支持语音指令实时自改代码并自动提交 Git,实现声控 UI 迭代。

A

基本安全,请在特定环境下使用

  • 来自社区或个人来源,建议先隔离验证
  • ❌ **API Key 暴露风险**: server.cjs 第 44 行通过 `/api/key` 端点将 OPENAI_API_KEY 明文返回给前端,任何可访问网页的用户都能获取该密钥
  • ⚠️ **配置文件安全**: start.sh 通过命令替换和 Python 脚本解析配置文件获取敏感信息,需确保配置文件权限设置正确(仅所有者可读)
  • ⚠️ **硬编码路径**: CONTEXT.md 中硬编码了特定用户路径 `/Users/yuki/...`,可能存在可移植性和隐私泄露风险
  • ✅ **无危险代码执行**: 未检出 eval()、exec()、system() 等直接执行用户输入的危险函数,无 SQL 注入或命令注入漏洞
  • ✅ **依赖安全可靠**: 仅依赖锁定版本的 ws@^8.0.0,无动态代码加载或远程脚本执行行为

使用说明

Voice UI 是一款创新的自进化型语音助手界面,集成了 OpenAI 的 Whisper 语音识别和 TTS 语音合成技术,允许用户通过自然语言对话与 AI 交互,并直接通过语音指令修改自身的 UI 代码(CSS、JavaScript 或 HTML),实现"边聊边改"的实时自进化体验。

核心用法上,用户在本地启动 Node.js 服务后,通过浏览器访问界面,按住麦克风按钮或空格键进行语音输入。AI 识别指令后,不仅能进行常规对话,还能执行"自我进化"命令,如修改背景颜色、调整按钮大小或添加新功能,所有代码变更会自动提交到 Git 仓库,便于版本管理。

该技能的显著优点在于其前沿的自进化概念,将语音交互与代码生成相结合,大大降低了 UI 调整和功能迭代的门槛。可爱的机器人表情变化增强了交互趣味性,而自动 Git 提交功能则为开发者提供了便利的版本控制。对于需要快速原型验证或频繁调整界面的场景,这种声控编程方式极具创新价值。

然而,该技能存在明显的局限性和风险。首先,安全报告显示 API Key 通过 /api/key 端点明文暴露给前端,任何能访问网页的用户都能获取 OpenAI API Key,因此绝对不能部署在公共网络,仅适合本地开发环境使用。其次,作为 T3 级个人开发者项目,缺乏大型组织背书,代码维护的长期稳定性存疑。此外,功能重度依赖 OpenAI 服务,存在网络延迟和 API 费用成本。

该技能适合前端开发者、AI 产品经理、语音交互研究者以及希望探索"自编程"概念的极客用户。对于需要构建语音助手原型的团队,这也是一个有价值的参考实现。

使用风险方面,除了 API Key 泄露可能导致的经济损失外,用户还需注意配置文件的权限设置,防止敏感信息被其他用户读取。自动代码修改功能虽然便利,但在生产环境中使用前应进行严格的人工审查,避免 AI 生成代码引入安全漏洞或功能缺陷。建议在隔离的本地环境或可信内网中使用,并定期轮换 API Key。

voice-ui 内容

手动下载zip · 10.8 kB
CONTEXT.mdtext/markdown
请选择文件