ai-podcast-creation

🎙️ AI驱动的专业播客制作工坊

🥥50总安装量 11评分人数 13
100% 的用户推荐

基于inference.sh平台整合Kokoro与DIA等先进TTS模型,支持多角色对话与AI音乐生成,零门槛制作专业级播客与有声书内容。

A

基本安全,请在特定环境下使用

  • 来自社区或个人来源,建议先隔离验证
  • ✅ 纯文档型资产,无隐藏可执行代码,仅包含 CLI 使用示例与模板
  • ✅ 无敏感凭证硬编码,无 API Key、密码等泄露风险
  • ⚠️ 来源等级为 T3(个人开发者 okaris/openclaw),非官方技术组织背书
  • ⚠️ 需申请 Bash(infsh *) 权限执行外部 CLI,依赖 inference.sh 平台安全性
  • ⚠️ 用户文本内容需上传至云端处理,需遵守第三方平台隐私政策

使用说明

AI Podcast Creation 是一款基于 inference.sh 云平台的文档型播客制作技能,通过 CLI 工具链提供从脚本创作到音频成品的完整工作流。用户可利用该技能调用 Kokoro TTS、DIA TTS 等先进语音合成模型,结合 AI 音乐生成与媒体合并工具,实现单人旁白、双人对谈、有声书章节等多种音频内容形态的自动化生产。

核心用法方面,该技能采用管道化设计:首先通过 LLM(如 Claude)生成结构化脚本,标记不同说话人角色;随后利用 infsh app run 命令分别调用特定语音模型(如 am_michael 主持音、af_sarah 嘉宾音)生成独立音轨;最后通过 media-merger 工具进行交叉淡入淡出、背景音乐叠加(建议音量 10-15%)及音轨拼接,输出完整剧集。特别值得一提的是其 NotebookLM 风格功能,可将长文档自动转换为双人讨论式播客脚本,并生成自然对话音频。

显著优点体现在:一是语音库丰富,涵盖美音/英音男女声及对话式 DIA 模型,支持语速调节与情感表达;二是提供完整的工业级模板,包括访谈格式、独白结构、新闻综述等,并附带脚本写作最佳实践(如自然停顿标点、口语化填充词使用);三是纯文档属性带来的透明性,所有操作均为可审计的 CLI 命令示例,无黑盒代码。

潜在局限包括:严重依赖 inference.sh 第三方云服务,需持续网络连接且产生平台计费;作为 T3 级个人来源项目,缺乏企业级维护背书;文档未明确说明中文语音支持情况,主要示例针对英文内容;长文本生成可能受限于云端 API 的速率与字数限制。

适合群体主要为独立播客创作者、内容营销人员、教育工作者(制作课程音频)、有声书自出版作者,以及寻求 NotebookLM 替代方案需将文档转为音频的用户。不适用于对数据主权要求极高的涉密场景或需离线工作的环境。

使用风险需关注:执行 infsh 命令需授予 Bash 权限,应确保 CLI 安装源(https://cli.inference.sh)可信;用户脚本与生成内容将上传至远程服务器处理,需仔细阅读 inference.sh 隐私政策;长时间音频生成可能产生意外费用,建议预先了解平台计费规则;网络中断可能导致制作流程中断且难以断点续传。

ai-podcast-creation 内容

手动下载zip · 3.1 kB
SKILL.mdtext/markdown
请选择文件