expanso-pii-detect

🔒 智能隐私信息检测与合规助手

🥥39总安装量 12评分人数 15
100% 的用户推荐

Expanso 官方出品的 PII 检测技能,基于 GPT-4o-mini 智能识别文本中的个人身份信息,助力企业数据合规与隐私保护。

S

安全性较高,可在多数场景中优先使用

  • 来自可信组织或认证账号,需要结合权限范围判断
  • ✅ 代码安全规范,无 eval/exec/system 等危险函数
  • ✅ 无动态代码加载,依赖版本完全锁定
  • ✅ 完善的输入验证与错误处理机制
  • ⚠️ 需将数据发送至 OpenAI API 进行分析(功能必需)
  • ⚠️ 需要用户自行配置 OPENAI_API_KEY 环境变量

使用说明

核心用法

pii-detect 是一款专注于个人身份信息(PII)检测的 Agent Skill,由 Expanso 团队开发。该技能提供三种部署模式:CLI 管道模式适合命令行快速检测,MCP 模式可作为服务长期运行,Expanso Cloud 模式支持云端规模化部署。用户通过环境变量配置 OPENAI_API_KEY 和可选的 PII_TYPES 检测类型,即可对输入文本进行智能分析,输出结构化的 PII 检测结果。

显著优点

1. 智能识别能力:采用 GPT-4o-mini 模型,相比传统正则表达式能识别更复杂的 PII 变体和上下文关联信息
2. 灵活部署:支持本地 CLI、MCP 服务和云端三种模式,适应不同架构需求

3. 审计友好:自动生成 trace_id 和 input_hash,便于合规审计和结果追踪

4. 隐私保护设计:输入内容仅发送哈希值用于追踪,原始数据通过 HTTPS 传输至 OpenAI API

5. 降级能力:支持纯 regex 模式运行,无需 API Key 即可进行基础检测

潜在缺点与局限性

1. 外部依赖强:核心功能依赖 OpenAI API,离线环境无法使用完整功能
2. 延迟问题:LLM 调用带来额外网络延迟,不适合实时性要求极高的场景

3. 成本考量:持续调用 GPT-4o-mini 会产生 API 费用,高频使用需评估成本

4. 准确率边界:AI 检测存在误报/漏报可能,关键场景建议人工复核

5. 输入限制:默认 1MB 缓冲区限制,超大文本需分批处理

适合的目标群体

  • 数据工程师:构建数据脱敏和 DLP 管道
  • 合规团队:执行 GDPR、CCPA 等隐私法规检查
  • 安全运维:日志审计前的敏感信息筛查
  • 开发者:集成隐私感知的数据处理工作流

使用风险

1. 数据出境风险:检测数据需发送至 OpenAI 服务器,跨国企业需评估合规性
2. API 密钥管理:OPENAI_API_KEY 需安全存储,避免泄露导致费用损失

3. 模型版本锁定:当前锁定 gpt-4o-mini,未来模型升级可能需要手动更新配置

4. 沙箱依赖:功能依赖 Expanso Edge 运行时环境,需确保正确安装和版本兼容

expanso-pii-detect 内容

文件夹图标test文件夹
文件夹图标fixtures文件夹
手动下载zip · 6.4 kB
input.txttext/plain
请选择文件