flexible-data-importer

📥 AI驱动的多格式数据自动入库

🥥63总安装量 17评分人数 12
100% 的用户推荐

OpenClaw出品的AI数据导入工具,支持CSV/JSON/XLSX自动解析并生成Supabase数据库结构,实现零配置ETL流程。

C

存在明显风险,不建议直接用于敏感场景

  • 来自社区或个人来源,建议先隔离验证
  • ❌ <br/>**高危依赖漏洞**:`xlsx@0.18.5` 存在 Prototype Pollution(CVSS 7.8)和 ReDoS(CVSS 7.5)漏洞,暂无可用修复版本,处理不可信 XLSX 文件存在安全风险
  • ⚠️ <br/>**来源可信度**:T3 级别(个人开发者),建议进行代码审计后使用,长期维护稳定性存疑
  • ⚠️ <br/>**敏感权限需求**:需配置 SUPABASE_KEY 和 OPENAI_API_KEY 等高敏感凭证,且申请网络、文件系统、LLM 权限
  • ✅ <br/>**代码执行安全**:无 eval/exec/system/child_process 等危险函数,无破坏性系统命令
  • ✅ <br/>**数据隐私保护**:无静默数据收集或上传行为,敏感信息通过环境变量配置(非硬编码),使用 zod 进行输入验证

使用说明

OpenClaw Data Importer 是一款面向开发者的 AI 驱动数据摄取工具,专注于解决异构数据格式快速入库的痛点。用户只需通过 CLI 命令 data-importer <file-path> 或 API 调用 UniversalImporter.execute(),并提供 Supabase 项目 URL 和 Service Role Key,即可自动完成从 CSV、JSON、XLSX 文件到结构化数据库的完整 ETL 流程。该工具的核心在于其智能模式生成能力:通过 LLM 分析数据特征,自动推断字段类型(如字符串智能转换为日期或数值)、识别表间关系,并生成优化的 Supabase 数据库结构,无需人工预先定义表结构。批量上传功能确保大型历史数据集能够稳定导入,避免内存溢出。

该 Skill 的显著优势在于其零配置理念和开发效率提升。自动模式生成消除了传统 ETL 工具繁琐的 schema 定义步骤;类型安全机制减少了数据清洗的人工干预;对多种主流格式的原生支持降低了集成复杂度。对于快速原型开发、内部数据迁移或轻量级数据仓库建设场景,能够大幅缩短从原始数据到可用数据库的交付时间。

然而,该工具存在明显的安全与可靠性局限。最突出的问题是依赖的高危漏洞:底层使用的 xlsx@0.18.5 包存在 Prototype Pollution(GHSA-4r6h-8v6p-xvw6,CVSS 7.8)和正则表达式拒绝服务(GHSA-5pgg-2g8v-p4x9,CVSS 7.5)漏洞,且当前暂无可用修复版本。此外,作为 T3 来源(个人开发者)项目,代码审计和长期维护存在不确定性。功能层面,错误处理机制文档不够详尽,且需要用户暴露高权限的 Supabase Service Role Key。

该 Skill 适合具备一定安全意识的开发者、数据工程师以及需要快速验证数据产品的初创团队使用。特别适用于内部工具开发、一次性数据迁移、测试环境构建等对安全要求相对宽松的场景。

使用过程中需警惕多重风险:处理来自不可信来源的 XLSX 文件可能导致原型污染攻击;依赖漏洞在 Node.js 环境中可能被利用于拒绝服务;Supabase Service Role Key 的泄露将导致数据库完全暴露;大文件处理可能引发内存或性能问题。建议在隔离环境(如 Docker 容器)中运行,严格审查输入文件来源,并监控 xlsx 包的更新动态。

flexible-data-importer 内容

手动下载zip · 41.6 kB
package-lock.jsonapplication/json
请选择文件