note-processor · COCOLOOP

使用说明

核心用法

note-processor 是一款专为 research-assistant 配套设计的本地研究笔记分析工具，通过命令行接口提供四大核心功能：

1. summarize <topic>：生成主题概览，包含笔记数量、字数统计、时间范围、Top 5 标签、关键要点及最近3条笔记
2. keywords <topic>：提取高频关键词（过滤停用词），展示前20个关键词及其出现频次
3. extract <topic> <keyword>：在指定主题中搜索包含特定关键词的所有笔记，高亮显示匹配内容
4. list：列出所有研究主题及其基础统计信息

工具直接读取 ~/.openclaw/workspace/research_db.json 数据库文件，与 research-assistant 共享数据格式，形成「记录→分析→输出」的完整工作流。

显著优点

零成本零依赖：仅使用 Python 标准库（sys/json/re/pathlib/datetime/collections），无需安装任何第三方包，无 API Key 需求
极速响应：本地文件读取，无网络延迟，适合高频次查询场景
智能关键要点识别：通过模式匹配自动标记包含 "important/key/critical/must/should/note/remember/warning/priority" 等信号词的句子，帮助快速定位 actionable insights
完善的停用词过滤：内置20+常见英语停用词过滤，提升关键词质量
清晰的输出格式：采用结构化视觉设计（emoji分隔、缩进层级、高亮标记），便于快速浏览

潜在缺点与局限性

无语义理解能力：关键词提取基于纯频率统计，非 NLP/ML 方案，无法识别同义词或进行主题建模
英语中心化：停用词列表针对英语优化，其他语言需手动定制
关键要点检测机械化：仅依赖关键词模式匹配，无法理解句子真正重要性
单用户本地架构：无多用户支持、无跨设备同步、无协作功能
数据格式强绑定：仅兼容 research-assistant 的特定 JSON 结构，灵活性受限

适合的目标群体

个人研究者/知识工作者：需要定期回顾和整理研究笔记，提取写作素材
学生与学术用户：管理课程笔记、文献阅读记录，准备报告前快速定位关键信息
独立开发者/技术写作者：追踪技术调研过程，整理实验记录和结论
research-assistant 现有用户：希望扩展笔记分析能力，形成完整工具链
隐私敏感型用户：拒绝云端笔记服务，坚持本地优先的数据策略

使用风险

数据可用性依赖：若 research_db.json 文件被移动、损坏或权限变更，工具将无法正常读取
research-assistant 强耦合：单独使用价值有限，需前置配合 research-assistant 积累笔记数据
关键词质量波动：笔记写作风格直接影响提取效果，口语化、缩写过多会导致关键词无意义
无备份机制：工具本身不提供数据备份功能，用户需自行管理数据库文件安全
扩展性天花板：纯标准库实现虽保证安全，但也限制了高级功能（如向量化检索、语义搜索）的演进空间

productivity docs education-research data-analytics automation

note-processor 内容

scripts文件夹

手动下载zip · 5.9 kB

note_processor.pytext/plain

请选择文件