sag

🗣️ 极简 ElevenLabs 语音合成工具

🥥64总安装量 15评分人数 18
100% 的用户推荐

基于 ElevenLabs 的 TTS 工具,提供 macOS 风格 say 命令体验,支持多语音角色与情感标签,适合开发者快速生成高质量语音内容。

B

存在边界风险,建议在隔离环境中验证

  • 来自可信组织或认证账号,需要结合权限范围判断
  • ✅ 纯文档型 Skill,无内嵌可执行代码,无恶意代码执行风险
  • ✅ API Key 管理透明,由用户通过环境变量自行控制,无硬编码密钥
  • ⚠️ 文本内容需发送至 ElevenLabs 第三方服务器进行语音合成,存在数据外传
  • ⚠️ 依赖外部二进制 sag 和 ElevenLabs API 服务,可用性受第三方影响
  • ✅ 通过官方 Homebrew 渠道分发,来源可追溯,无供应链污染风险

使用说明

核心用法

sag 是一款封装 ElevenLabs API 的命令行文本转语音工具,主打 macOS 原生 say 命令的简洁交互体验。用户通过环境变量配置 API Key 后,可直接在终端输入文本生成语音,支持本地播放或导出音频文件。核心命令包括基础朗读 sag "文本"、指定语音角色 sag -v Roger "文本"、查看可用声线 sag voices 等。工具内置 v3/v2/v2.5 多模型切换,v3 版本支持 [whispers]]、][excited]]、][sings]] 等情感标签,v2 系列则兼容 SSML <break>> 标签实现精细停顿控制。

显著优点

1. 交互极简:复刻 macOS say 命令的直觉式用法,零学习成本上手
2. 音质领先:背靠 ElevenLabs 业界顶尖的神经网络语音合成技术

3. 角色丰富:内置多风格声线,支持科学家、耳语、歌唱等场景化表达

4. 模型灵活:v3 侧重表现力,v2.5 追求速度,可按场景切换

5. 生态成熟:通过 Homebrew 分发,安装维护便捷

潜在缺点与局限性

  • 成本门槛:ElevenLabs API 为付费服务,高频使用需承担费用
  • 平台绑定:主要面向 macOS 用户,跨平台体验可能受限
  • 功能边界:SSML <phoneme>> 未暴露,精细发音控制不足;v3 不支持标准 SSML 语法
  • 网络依赖:所有合成请求必须联网,无法离线使用
  • 数据隐私:文本内容需上传至 ElevenLabs 服务器处理

适合的目标群体

  • 开发者与技术人员:需要快速生成演示音频、语音通知或自动化语音内容
  • 内容创作者:播客、视频制作中的配音辅助工具
  • 无障碍开发者:为应用添加语音反馈功能
  • AI 助手构建者:为聊天机器人配置语音回复能力

使用风险

  • API 费用累积:未设置用量上限可能导致意外账单
  • Key 泄露风险:环境变量管理不当可能造成密钥暴露
  • 外部依赖:sag 二进制与 ElevenLabs 服务的可用性直接影响功能
  • 音频文件管理:生成文件需手动清理,长期运行可能占用磁盘空间

sag 内容

手动下载zip · 1.5 kB
SKILL.mdtext/markdown
请选择文件