specification-extractor

📐 CSI建筑规范智能解析工具

🥥48总安装量 19评分人数 22
100% 的用户推荐

基于CSI MasterFormat标准,自动解析建筑规范PDF,提取产品要求和提交物清单,显著提升工程估算与采购效率。

A

基本安全,请在特定环境下使用

  • 来自社区或个人来源,建议先隔离验证
  • ✅ 纯文档型资产,无自动执行代码,内容完全透明可审计
  • ✅ 无危险函数调用(eval/exec/system/subprocess),无数据上传或网络通信功能
  • ✅ 仅使用标准库和成熟的 pdfplumber 库进行本地 PDF 只读操作,无系统破坏性命令
  • ⚠️ 代码示例需用户手动复制执行,需主动安装 pdfplumber 依赖,无自动运行机制
  • ⚠️ 来源为 T3 级社区/个人账号,建议用户验证代码逻辑后再投入使用

使用说明

该 Skill 提供了一套完整的建筑规范文档解析方案,基于 Python 的 pdfplumber 库实现。用户可通过 SpecificationExtractor 类从 PDF 规范文档中提取 CSI MasterFormat 标准章节(如 03 30 00 混凝土),自动识别 Part 1(总体要求)、Part 2(产品要求)、Part 3(施工执行)的结构化内容。系统能够精准提取产品制造商信息、材料标准(ASTM、ANSI、ACI 等)、提交物要求(施工图、样品、产品数据等),并自动生成提交物日志、产品清单和综合分析报告。

显著优点:首先,自动化处理大幅提升了工程前期准备效率,传统需要人工逐页阅读的数百页规范文档可在数秒内完成结构化解析。其次,输出格式专业且多样化,包括 Markdown 格式的提交物跟踪表、产品进度表和综合分析报告,可直接用于项目管理和采购流程。第三,严格遵循 CSI MasterFormat 行业标准,确保提取的数据符合建筑行业规范,支持 ASTM、ANSI、ACI 等主流标准组织的规范引用识别。

潜在缺点或局限性:该工具主要依赖 pdfplumber 进行文本提取,对扫描版 PDF 或复杂排版格式的文档解析效果可能不佳,需要源文档具有良好的文本层。此外,Skill 本身仅为代码示例和文档,需要用户具备 Python 编程能力并手动配置运行环境,无法直接作为独立应用程序使用。正则表达式匹配模式在面对非标准规范格式时可能出现识别误差,需要人工校验关键数据。

适合的目标群体:主要面向建筑行业的专业人士,包括:工程造价估算师,用于快速识别工程范围和产品规格;采购经理,用于准确提取产品制造商和型号信息;项目工程师,用于跟踪和管理提交物要求;合规检查员,用于验证规范是否符合行业标准。同时适合开发建筑管理自动化工具的软件工程师作为基础组件使用。

使用风险:性能方面,大型 PDF 文件(数百页)解析可能消耗较多内存和处理时间。准确性方面,OCR 不清晰的文档或非标格式规范可能导致信息提取不完整。依赖项方面,需要安装 pdfplumber 及其底层依赖(如 pdfminer.six),在特定操作系统环境下可能存在安装兼容性问题。数据安全方面,虽然处理过程完全本地进行,但用户需确保输入的规范文档不包含敏感商业信息泄露风险。

specification-extractor 内容

手动下载zip · 4.0 kB
SKILL.mdtext/markdown
请选择文件