ai-podcast-pipeline

🎙️ 韩语双主持 AI 播客智能生产线

🥥43总安装量 12评分人数 12
100% 的用户推荐

基于 Google Gemini 的端到端韩语播客制作工具,支持双主持 TTS 与自动字幕渲染,快速生成专业播客资产。

A

基本安全,请在特定环境下使用

  • 来自社区或个人来源,建议先隔离验证
  • ✅ 通过 BSS 安全审计,无 eval/exec 等危险代码执行,符合 A 级安全标准
  • ✅ API 密钥通过环境变量管理,无硬编码敏感信息泄露风险
  • ✅ 输入输出路径使用 pathlib 安全处理,无命令注入漏洞
  • ⚠️ 使用 subprocess 调用 ffmpeg 进行音视频处理(功能必需的安全用法)
  • ⚠️ 需网络访问 Google Gemini API,依赖外部云服务稳定性
  • ⚠️ 来源为 T3 级个人开发者(jeong-wooseok),虽代码规范但需注意长期维护风险

使用说明

AI Podcast Pipeline 是一套专为韩语内容创作者设计的端到端 AI 播客制作工具链,版本 0.1.5 提供了从原始趋势笔记到成品播客包的全自动化生产能力。

核心用法方面,该技能通过七个标准化步骤实现工作流:首先选择 QuickView 趋势笔记作为数据源,随后生成双主持(Callie × Nick)对话脚本,支持完整版(15-20 分钟)和压缩版(5-7 分钟)两种模式。接着利用 Google Gemini 多说话人 TTS 技术生成双声道音频,通过分块构建策略确保长文本处理的可靠性。随后自动生成完整韩语字幕(无省略号截断),并渲染为带字幕的 MP4 视频,支持字体、字号和时间偏移调整。最后自动生成 YouTube 缩略图和元数据,形成可直接发布的完整资产包。

显著优点包括:双角色语音合成创造真实对话感;基于 Gemini 的 TTS 技术提供高质量韩语语音;全自动字幕生成与同步减少人工调整;支持分块处理避免 API 超时;完整的 YouTube 发布准备(标题、描述、缩略图);环境变量管理 API 密钥确保安全性。

潜在缺点在于:功能高度依赖 Google Gemini API 的可用性和网络连接;需要本地安装 ffmpeg 等外部工具;目前仅针对韩语优化,其他语言支持有限;作为 T3 来源的个人开发者项目,长期维护存在不确定性;对字体文件路径和外部 skill(nano-banana-pro)有硬性依赖。

适合的目标群体包括:韩语 AI 播客内容创作者、需要批量生成教育或新闻类音频节目的媒体工作者、希望通过自动化减少制作时间的 YouTube 播客主,以及探索 AI 语音合成应用的技术早期采用者。

使用风险主要包括:网络依赖风险(Gemini API 访问不稳定可能导致中断);API 密钥管理风险(用户需自行确保环境变量安全);外部工具依赖(ffmpeg 版本兼容性可能影响输出质量);文件系统权限(需要读写临时文件和输出目录);以及个人开发者维护风险(更新频率和功能延续性不确定)。

ai-podcast-pipeline 内容

文件夹图标references文件夹
文件夹图标scripts文件夹
手动下载zip · 19.6 kB
podcast_prompt_template_ko.mdtext/markdown
请选择文件