skills/odrobnik/gemini-yt-video-transcript

gemini-yt-video-transcript

📝 AI 驱动的视频转录助手

下载技能Zip包

2 次

🥥2

总安装量 1

评分人数 1

100% 的用户推荐

基于 Google Gemini 的 YouTube 视频转录工具，自动生成带说话人标签的逐字稿，无需时间戳，适合内容创作者快速获取视频文本。

基本安全，请在特定环境下使用

来自社区或个人来源，建议先隔离验证
✅ 无危险代码执行函数（eval/exec/system/subprocess 均未使用）
✅ API Key 通过环境变量获取，无硬编码敏感信息泄露风险
✅ 输出路径严格限制在工作区和 /tmp，防止目录遍历攻击
✅ 仅依赖 Python 标准库，无第三方包引入供应链风险
⚠️ 需将 YouTube URL 发送至 Google Gemini API（功能必需，用户可控）

了解 BSS 安全性认证标准 >zip · 3.7 kB

使用说明

核心用法

Gemini YouTube Video Transcript 是一款调用 Google Gemini API 的转录工具，用户只需提供 YouTube 视频 URL，即可生成结构化的逐字文本。工具通过 Python 脚本执行，输出格式包含视频标题和带说话人标签的对话内容，自动去除时间码和冗余标记，直接输出干净可读的转录文本。

显著优点

1. 零第三方依赖：仅使用 Python 标准库，无 pip 安装负担，部署极简
2. 输出格式友好：自动添加说话人标签和段落分隔，适合直接用于内容编辑或字幕制作
3. 路径安全控制：输出文件严格限制在工作区或 /tmp 目录，防止路径遍历攻击
4. 隐私设计合理：API Key 通过环境变量配置，无硬编码敏感信息
5. 功能聚焦：专注转录核心场景，无冗余功能干扰

潜在缺点与局限性

来源可信度有限：GitHub 个人账号维护，仅 2 Stars，社区验证不足
外部服务依赖：必须依赖 Google Gemini API 和 YouTube oEmbed 服务，网络中断即不可用
无时间戳信息：设计上去除时间码，不适合需要精确定位视频片段的场景
无许可证声明：项目未明确开源协议，存在潜在法律风险
处理能力受限：受 Gemini API 配额和 YouTube 视频时长限制

适合的目标群体

播客/视频创作者：快速获取访谈或演讲的文字稿
内容运营人员：批量处理公开视频内容做二次编辑
研究人员：整理线上讲座、会议录像的文本资料
字幕制作团队：获取基础转录文本后人工校对

使用风险

网络稳定性：需持续连接 Google 服务，国内用户可能需要特殊网络配置
API 成本控制：Gemini API 按 token 计费，长视频可能产生较高费用
隐私合规：视频 URL 和音频内容会传输至 Google 服务器，敏感内容需谨慎
服务可用性：个人维护项目，长期更新和支持存在不确定性

content-media productivity api automation docs

gemini-yt-video-transcript 内容

scripts文件夹

手动下载zip · 3.7 kB

youtube_transcript.pytext/plain

请选择文件