voice-ui

🎙️ 实时自进化的语音 AI 助手

下载技能Zip包

61 次

🥥61

总安装量 20

评分人数 15

100% 的用户推荐

基于 OpenAI 语音技术的自进化助手，支持语音指令实时自改代码并自动提交 Git，实现声控 UI 迭代。

基本安全，请在特定环境下使用

来自社区或个人来源，建议先隔离验证
❌ **API Key 暴露风险**: server.cjs 第 44 行通过 `/api/key` 端点将 OPENAI_API_KEY 明文返回给前端，任何可访问网页的用户都能获取该密钥
⚠️ **配置文件安全**: start.sh 通过命令替换和 Python 脚本解析配置文件获取敏感信息，需确保配置文件权限设置正确（仅所有者可读）
⚠️ **硬编码路径**: CONTEXT.md 中硬编码了特定用户路径 `/Users/yuki/...`，可能存在可移植性和隐私泄露风险
✅ **无危险代码执行**: 未检出 eval()、exec()、system() 等直接执行用户输入的危险函数，无 SQL 注入或命令注入漏洞
✅ **依赖安全可靠**: 仅依赖锁定版本的 ws@^8.0.0，无动态代码加载或远程脚本执行行为

了解 BSS 安全性认证标准 >zip · 10.8 kB

使用说明

Voice UI 是一款创新的自进化型语音助手界面，集成了 OpenAI 的 Whisper 语音识别和 TTS 语音合成技术，允许用户通过自然语言对话与 AI 交互，并直接通过语音指令修改自身的 UI 代码（CSS、JavaScript 或 HTML），实现"边聊边改"的实时自进化体验。

核心用法上，用户在本地启动 Node.js 服务后，通过浏览器访问界面，按住麦克风按钮或空格键进行语音输入。AI 识别指令后，不仅能进行常规对话，还能执行"自我进化"命令，如修改背景颜色、调整按钮大小或添加新功能，所有代码变更会自动提交到 Git 仓库，便于版本管理。

该技能的显著优点在于其前沿的自进化概念，将语音交互与代码生成相结合，大大降低了 UI 调整和功能迭代的门槛。可爱的机器人表情变化增强了交互趣味性，而自动 Git 提交功能则为开发者提供了便利的版本控制。对于需要快速原型验证或频繁调整界面的场景，这种声控编程方式极具创新价值。

然而，该技能存在明显的局限性和风险。首先，安全报告显示 API Key 通过 /api/key 端点明文暴露给前端，任何能访问网页的用户都能获取 OpenAI API Key，因此绝对不能部署在公共网络，仅适合本地开发环境使用。其次，作为 T3 级个人开发者项目，缺乏大型组织背书，代码维护的长期稳定性存疑。此外，功能重度依赖 OpenAI 服务，存在网络延迟和 API 费用成本。

该技能适合前端开发者、AI 产品经理、语音交互研究者以及希望探索"自编程"概念的极客用户。对于需要构建语音助手原型的团队，这也是一个有价值的参考实现。

使用风险方面，除了 API Key 泄露可能导致的经济损失外，用户还需注意配置文件的权限设置，防止敏感信息被其他用户读取。自动代码修改功能虽然便利，但在生产环境中使用前应进行严格的人工审查，避免 AI 生成代码引入安全漏洞或功能缺陷。建议在隔离的本地环境或可信内网中使用，并定期轮换 API Key。

voice ai-assistant productivity frontend automation development-engineering

voice-ui 内容

手动下载zip · 10.8 kB

CONTEXT.mdtext/markdown

请选择文件