核心用法
pii-detect 是一款专注于个人身份信息(PII)检测的 Agent Skill,由 Expanso 团队开发。该技能提供三种部署模式:CLI 管道模式适合命令行快速检测,MCP 模式可作为服务长期运行,Expanso Cloud 模式支持云端规模化部署。用户通过环境变量配置 OPENAI_API_KEY 和可选的 PII_TYPES 检测类型,即可对输入文本进行智能分析,输出结构化的 PII 检测结果。
显著优点
1. 智能识别能力:采用 GPT-4o-mini 模型,相比传统正则表达式能识别更复杂的 PII 变体和上下文关联信息
2. 灵活部署:支持本地 CLI、MCP 服务和云端三种模式,适应不同架构需求
3. 审计友好:自动生成 trace_id 和 input_hash,便于合规审计和结果追踪
4. 隐私保护设计:输入内容仅发送哈希值用于追踪,原始数据通过 HTTPS 传输至 OpenAI API
5. 降级能力:支持纯 regex 模式运行,无需 API Key 即可进行基础检测
潜在缺点与局限性
1. 外部依赖强:核心功能依赖 OpenAI API,离线环境无法使用完整功能
2. 延迟问题:LLM 调用带来额外网络延迟,不适合实时性要求极高的场景
3. 成本考量:持续调用 GPT-4o-mini 会产生 API 费用,高频使用需评估成本
4. 准确率边界:AI 检测存在误报/漏报可能,关键场景建议人工复核
5. 输入限制:默认 1MB 缓冲区限制,超大文本需分批处理
适合的目标群体
- 数据工程师:构建数据脱敏和 DLP 管道
- 合规团队:执行 GDPR、CCPA 等隐私法规检查
- 安全运维:日志审计前的敏感信息筛查
- 开发者:集成隐私感知的数据处理工作流
使用风险
1. 数据出境风险:检测数据需发送至 OpenAI 服务器,跨国企业需评估合规性
2. API 密钥管理:OPENAI_API_KEY 需安全存储,避免泄露导致费用损失
3. 模型版本锁定:当前锁定 gpt-4o-mini,未来模型升级可能需要手动更新配置
4. 沙箱依赖:功能依赖 Expanso Edge 运行时环境,需确保正确安装和版本兼容