yt-transcript

📜 一键提取视频字幕精华

🥥4总安装量 1评分人数 1
100% 的用户推荐

基于 Supadata API 与 yt-dlp 双引擎的 YouTube 字幕提取工具,支持自动生成字幕解析,为内容研究者节省 10-30 分钟/视频的信息获取时间。

A

基本安全,请在特定环境下使用

  • 来自社区或个人来源,建议先隔离验证
  • ✅ 无危险函数调用,未使用 eval/exec/system 等高风险 API
  • ✅ 数据隐私合规,仅访问 YouTube 公开字幕,不收集用户敏感信息
  • ✅ 输入验证完善,视频 ID 经正则校验,错误处理机制健全
  • ⚠️ 依赖第三方社区包(youtube-captions-scraper、youtubei.js),需关注安全更新
  • ⚠️ Shell 脚本使用正则解析 HTML,存在因 YouTube 页面变更导致解析失败的风险

使用说明

核心用法

YouTube Transcript Extractor 是一款专注于视频字幕提取的实用工具,用户只需提供 YouTube 视频 URL 或视频 ID,即可快速获取纯文本格式的字幕内容。该技能采用双引擎架构:优先调用 Supadata API 实现秒级响应,当 API 不可用时自动降级至 yt-dlp 命令行工具,确保高可用性。输出结果已自动清理时间戳,直接呈现可读性强的纯文本,便于后续分析处理。

显著优点

双重保障机制是该技能的核心竞争力。Supadata API 提供商业化级别的稳定服务,而 yt-dlp 作为开源社区维护的成熟工具,能够处理各种边缘场景,包括无人工字幕时提取自动生成字幕的能力。这种设计显著提升了成功率,避免了单点故障。此外,工具对输入参数进行了完善的正则验证,错误处理机制成熟,用户体验友好。

潜在缺点与局限性

首先,该技能依赖第三方服务,Supadata API 需要配置密钥,且存在调用配额和成本考量;yt-dlp 则依赖 YouTube 页面结构的稳定性,官方调整可能导致解析失效。其次,Shell 脚本采用正则表达式解析 HTML,虽经安全审计无注入风险,但解析鲁棒性不及官方 SDK。最后,技能仅支持公开视频,私有视频、年龄限制内容或区域封锁视频无法获取字幕。

适合的目标群体

该技能特别适合内容创作者、研究人员、学生及知识工作者。对于需要快速消化大量视频信息的人群,如播客听众转文字稿、在线教育课程笔记整理、市场趋势视频分析等场景,能显著提升信息处理效率。同时,AI 应用开发者也可将其作为视频理解 pipeline 的前置组件。

使用风险

常规风险主要包括:网络依赖(需稳定连接 YouTube 服务器)、速率限制(高频调用可能触发平台限流)、依赖维护(youtube-captions-scraper 等社区包需关注安全更新)。建议用户控制请求频率,避免用于大规模自动化爬取,以防账号或 IP 受限。

yt-transcript 内容

文件夹图标scripts文件夹
手动下载zip · 7.4 kB
transcript.jstext/javascript
请选择文件