gemini-yt-video-transcript

📝 AI 驱动的视频转录助手

🥥2总安装量 1评分人数 1
100% 的用户推荐

基于 Google Gemini 的 YouTube 视频转录工具,自动生成带说话人标签的逐字稿,无需时间戳,适合内容创作者快速获取视频文本。

A

基本安全,请在特定环境下使用

  • 来自社区或个人来源,建议先隔离验证
  • ✅ 无危险代码执行函数(eval/exec/system/subprocess 均未使用)
  • ✅ API Key 通过环境变量获取,无硬编码敏感信息泄露风险
  • ✅ 输出路径严格限制在工作区和 /tmp,防止目录遍历攻击
  • ✅ 仅依赖 Python 标准库,无第三方包引入供应链风险
  • ⚠️ 需将 YouTube URL 发送至 Google Gemini API(功能必需,用户可控)

使用说明

核心用法

Gemini YouTube Video Transcript 是一款调用 Google Gemini API 的转录工具,用户只需提供 YouTube 视频 URL,即可生成结构化的逐字文本。工具通过 Python 脚本执行,输出格式包含视频标题和带说话人标签的对话内容,自动去除时间码和冗余标记,直接输出干净可读的转录文本。

显著优点

1. 零第三方依赖:仅使用 Python 标准库,无 pip 安装负担,部署极简
2. 输出格式友好:自动添加说话人标签和段落分隔,适合直接用于内容编辑或字幕制作

3. 路径安全控制:输出文件严格限制在工作区或 /tmp 目录,防止路径遍历攻击

4. 隐私设计合理:API Key 通过环境变量配置,无硬编码敏感信息

5. 功能聚焦:专注转录核心场景,无冗余功能干扰

潜在缺点与局限性

  • 来源可信度有限:GitHub 个人账号维护,仅 2 Stars,社区验证不足
  • 外部服务依赖:必须依赖 Google Gemini API 和 YouTube oEmbed 服务,网络中断即不可用
  • 无时间戳信息:设计上去除时间码,不适合需要精确定位视频片段的场景
  • 无许可证声明:项目未明确开源协议,存在潜在法律风险
  • 处理能力受限:受 Gemini API 配额和 YouTube 视频时长限制

适合的目标群体

  • 播客/视频创作者:快速获取访谈或演讲的文字稿
  • 内容运营人员:批量处理公开视频内容做二次编辑
  • 研究人员:整理线上讲座、会议录像的文本资料
  • 字幕制作团队:获取基础转录文本后人工校对

使用风险

  • 网络稳定性:需持续连接 Google 服务,国内用户可能需要特殊网络配置
  • API 成本控制:Gemini API 按 token 计费,长视频可能产生较高费用
  • 隐私合规:视频 URL 和音频内容会传输至 Google 服务器,敏感内容需谨慎
  • 服务可用性:个人维护项目,长期更新和支持存在不确定性

gemini-yt-video-transcript 内容

文件夹图标scripts文件夹
手动下载zip · 3.7 kB
youtube_transcript.pytext/plain
请选择文件