content-moderation

🛡️ AI 驱动的全场景内容安全审核

🥥94总安装量 20评分人数 13
100% 的用户推荐

基于 Vettly API 的全能内容审核方案,支持文本图像视频多模态检测,助力平台实现自动化内容安全合规与风险管控。

A

基本安全,请在特定环境下使用

  • 来自社区或个人来源,建议先隔离验证
  • ✅ 纯文档型资产,无本地代码执行风险,仅提供配置指引与接口封装
  • ⚠️ 需用户主动配置 VETTLY_API_KEY,内容数据将发送至第三方云服务进行处理
  • ⚠️ 依赖外部 MCP 服务器 @vettly/mcp,通过 npx 动态获取,存在版本漂移与供应链风险
  • ✅ 权限声明透明,metadata.openclaw 明确声明所需环境变量与二进制依赖
  • ⚠️ 功能依赖网络连接,离线环境无法使用,且受 Vettly 服务可用性制约

使用说明

这是一个基于 Vettly 内容审核 API 的 MCP 服务器集成方案,专为需要自动化内容安全检测的平台设计。该技能通过封装 Vettly 的 AI 审核能力,为开发者提供了一套完整的内容治理工具链,覆盖文本、图像、视频三种主流内容形态。

核心用法
该技能提供五大核心功能:moderate_content 用于执行实际的内容审核,支持对文本、图片 URL 或视频流进行安全性评分,并返回详细的分类风险指标与处置建议;validate_policy 允许在部署前验证 YAML 格式的审核策略配置,避免因语法错误导致生产事故;list_policies 用于浏览账户下可用的策略模板,便于多业务线场景下的策略选择;get_usage_stats 提供成本监控能力,可按时间维度统计 API 调用量与费用支出;get_recent_decisions 则支持审核日志审计,可按内容类型、处置结果等维度筛选历史决策记录。

显著优点
最突出的优势在于多模态统一处理能力,单一接口即可覆盖文本 toxicity 检测、图像暴力色情识别、视频内容合规审查等多种场景。策略系统的灵活性也是亮点,用户可通过 YAML 自定义风险阈值(如将仇恨言论阈值设为 0.8)并配置分级处置动作(标记/拦截),实现细粒度的内容治理。此外,完整的审计追溯与成本可视化功能,使运营团队能够清晰掌握内容安全态势与预算消耗。

潜在局限
首要限制是强外部依赖,所有审核逻辑实际运行在 Vettly 云端,技能本身仅为调用封装,这意味着网络中断或 Vettly 服务故障将直接导致审核能力瘫痪。数据隐私方面,用户内容必须上传至第三方服务器处理,对金融、医疗等敏感行业可能存在合规障碍。成本层面,随着业务量增长,API 调用费用可能累积为可观支出,且 npx 动态获取依赖的方式存在版本漂移风险。

适用群体
该技能特别适合用户生成内容(UGC)密集的平台,如社区论坛、社交媒体、电商评论系统;需要实时内容过滤的直播或短视频平台;以及拥有多租户架构、需要为不同客户配置差异化审核策略的 SaaS 服务商。对于缺乏自建 AI 审核能力的小型团队,这是快速上线内容安全功能的捷径。

使用风险
主要风险集中在数据外发合规性,使用前需确保 Vettly 的数据处理条款符合业务所在地的隐私法规(如 GDPR、CCPA)。API 密钥管理不当可能导致额度盗用或数据泄露,建议通过环境变量注入而非硬编码方式配置。此外,AI 审核存在误判可能,过度依赖自动决策可能误伤正常内容或漏过违规内容,建议保留人工复核机制作为兜底。

content-moderation 内容

手动下载zip · 1.9 kB
SKILL.mdtext/markdown
请选择文件