expanso-pii-redact

🔒 AI 驱动的隐私数据自动脱敏

🥥57总安装量 17评分人数 12
100% 的用户推荐

来自 Expanso 团队的 PII 脱敏工具,基于 GPT-4o-mini 智能识别并替换文本敏感信息,支持本地 Ollama 后端确保数据隐私,助力 GDPR 合规。

S

安全性较高,可在多数场景中优先使用

  • 来自可信组织或认证账号,需要结合权限范围判断
  • ✅ 代码安全规范:采用 YAML 声明式配置,无 eval/exec/system 等危险函数,无动态代码加载或命令注入漏洞
  • ✅ 隐私保护增强:支持 Ollama 本地后端,可实现完全本地化处理,避免敏感数据出境传输
  • ⚠️ 第三方数据传输:默认模式下需将文本传输至 OpenAI API 进行处理,用户需知悉数据跨境风险
  • ⚠️ 检测准确性限制:基于 LLM 的 PII 检测可能存在误报或漏报,不适合要求 100% 确定性的最高机密场景
  • ✅ 权限控制严格:仅需 OPENAI_API_KEY(可选),权限申请与功能完全匹配,无过度授权行为

使用说明

pii-redact 是 Expanso 团队开发的智能隐私数据脱敏工具,基于 Expanso Edge 框架构建,专门用于自动识别并替换文本中的个人身份信息(PII)。该技能采用 YAML 声明式配置,支持通过 CLI 命令行、MCP 服务器以及 Expanso Cloud 三种方式部署运行,用户可根据场景选择最适合的集成方案。其核心工作流程是利用 GPT-4o-mini 模型分析输入文本,识别姓名、身份证号、银行卡号等敏感信息,并将其替换为占位符(如 [REDACTED]),从而在保留数据结构的同时消除隐私风险。

该技能的显著优势在于其安全性与灵活性的平衡。首先,代码层面完全无危险函数调用,采用纯声明式配置,消除了命令注入和代码执行风险。其次,它提供了独特的隐私增强选项:除了默认的 OpenAI API 模式外,还支持连接本地 Ollama 后端进行完全离线处理,这对于处理高度敏感的企业内部数据或符合严格数据主权要求的场景至关重要。此外,Expanso Edge 框架内置了输入验证和错误处理机制,超时设置合理(60秒),且错误信息经过精心设计,不会泄露原始敏感内容。

然而,用户需清醒认识到该工具的局限性。作为基于 LLM 的解决方案,其 PII 检测能力受限于模型的准确性和泛化能力,可能存在误报(将非敏感信息标记为 PII)或漏报(遗漏某些变形或新型的敏感信息)的情况。因此,它不适合用于处理需要 100% 确定性脱敏的最高机密数据,此类场景建议采用基于正则表达式或确定性算法的传统脱敏工具。此外,默认配置下数据需要传输至 OpenAI 服务器,尽管 Expanso 是可信的技术公司(Bacalhau 项目背后团队),但用户仍需评估第三方 API 使用的合规性。

该技能特别适合以下群体:需要快速实现 GDPR、CCPA 等隐私法规合规的数据保护官;需要对日志文件进行脱敏处理后再存储或分析的 DevOps 工程师;准备将数据集用于公开共享或机器学习训练前进行匿名化处理的数据科学家;以及希望自动化处理客服聊天记录、医疗记录等敏感文本的内容管理员。

使用过程中需关注以下风险:一是数据主权风险,若使用默认 OpenAI 后端,敏感数据将离开本地环境,建议对机密数据启用 Ollama 本地模式;二是 API 密钥管理风险,用户需通过环境变量安全配置 OPENAI_API_KEY,避免硬编码泄露;三是处理日志风险,该技能会记录脱敏数量等元数据,需确保日志存储位置的安全;四是准确性风险,建议在高风险场景下增加人工复核环节,避免 AI 误判导致数据可用性降低或隐私泄露。

expanso-pii-redact 内容

文件夹图标test文件夹
文件夹图标fixtures文件夹
手动下载zip · 5.5 kB
input.txttext/plain
请选择文件