content-moderation

使用说明

这是一个基于 Vettly 内容审核 API 的 MCP 服务器集成方案，专为需要自动化内容安全检测的平台设计。该技能通过封装 Vettly 的 AI 审核能力，为开发者提供了一套完整的内容治理工具链，覆盖文本、图像、视频三种主流内容形态。

核心用法
该技能提供五大核心功能：moderate_content 用于执行实际的内容审核，支持对文本、图片 URL 或视频流进行安全性评分，并返回详细的分类风险指标与处置建议；validate_policy 允许在部署前验证 YAML 格式的审核策略配置，避免因语法错误导致生产事故；list_policies 用于浏览账户下可用的策略模板，便于多业务线场景下的策略选择；get_usage_stats 提供成本监控能力，可按时间维度统计 API 调用量与费用支出；get_recent_decisions 则支持审核日志审计，可按内容类型、处置结果等维度筛选历史决策记录。

显著优点
最突出的优势在于多模态统一处理能力，单一接口即可覆盖文本 toxicity 检测、图像暴力色情识别、视频内容合规审查等多种场景。策略系统的灵活性也是亮点，用户可通过 YAML 自定义风险阈值（如将仇恨言论阈值设为 0.8）并配置分级处置动作（标记/拦截），实现细粒度的内容治理。此外，完整的审计追溯与成本可视化功能，使运营团队能够清晰掌握内容安全态势与预算消耗。

潜在局限
首要限制是强外部依赖，所有审核逻辑实际运行在 Vettly 云端，技能本身仅为调用封装，这意味着网络中断或 Vettly 服务故障将直接导致审核能力瘫痪。数据隐私方面，用户内容必须上传至第三方服务器处理，对金融、医疗等敏感行业可能存在合规障碍。成本层面，随着业务量增长，API 调用费用可能累积为可观支出，且 npx 动态获取依赖的方式存在版本漂移风险。

适用群体
该技能特别适合用户生成内容（UGC）密集的平台，如社区论坛、社交媒体、电商评论系统；需要实时内容过滤的直播或短视频平台；以及拥有多租户架构、需要为不同客户配置差异化审核策略的 SaaS 服务商。对于缺乏自建 AI 审核能力的小型团队，这是快速上线内容安全功能的捷径。

使用风险
主要风险集中在数据外发合规性，使用前需确保 Vettly 的数据处理条款符合业务所在地的隐私法规（如 GDPR、CCPA）。API 密钥管理不当可能导致额度盗用或数据泄露，建议通过环境变量注入而非硬编码方式配置。此外，AI 审核存在误判可能，过度依赖自动决策可能误伤正常内容或漏过违规内容，建议保留人工复核机制作为兜底。

content-media api customer-support operations security automation

content-moderation 内容

手动下载zip · 1.9 kB

SKILL.mdtext/markdown

请选择文件