核心用法
note-processor 是一款专为 research-assistant 配套设计的本地研究笔记分析工具,通过命令行接口提供四大核心功能:
1. summarize <topic>:生成主题概览,包含笔记数量、字数统计、时间范围、Top 5 标签、关键要点及最近3条笔记
2. keywords <topic>:提取高频关键词(过滤停用词),展示前20个关键词及其出现频次
3. extract <topic> <keyword>:在指定主题中搜索包含特定关键词的所有笔记,高亮显示匹配内容
4. list:列出所有研究主题及其基础统计信息
工具直接读取 ~/.openclaw/workspace/research_db.json 数据库文件,与 research-assistant 共享数据格式,形成「记录→分析→输出」的完整工作流。
显著优点
- 零成本零依赖:仅使用 Python 标准库(sys/json/re/pathlib/datetime/collections),无需安装任何第三方包,无 API Key 需求
- 极速响应:本地文件读取,无网络延迟,适合高频次查询场景
- 智能关键要点识别:通过模式匹配自动标记包含 "important/key/critical/must/should/note/remember/warning/priority" 等信号词的句子,帮助快速定位 actionable insights
- 完善的停用词过滤:内置20+常见英语停用词过滤,提升关键词质量
- 清晰的输出格式:采用结构化视觉设计(emoji分隔、缩进层级、高亮标记),便于快速浏览
潜在缺点与局限性
- 无语义理解能力:关键词提取基于纯频率统计,非 NLP/ML 方案,无法识别同义词或进行主题建模
- 英语中心化:停用词列表针对英语优化,其他语言需手动定制
- 关键要点检测机械化:仅依赖关键词模式匹配,无法理解句子真正重要性
- 单用户本地架构:无多用户支持、无跨设备同步、无协作功能
- 数据格式强绑定:仅兼容 research-assistant 的特定 JSON 结构,灵活性受限
适合的目标群体
- 个人研究者/知识工作者:需要定期回顾和整理研究笔记,提取写作素材
- 学生与学术用户:管理课程笔记、文献阅读记录,准备报告前快速定位关键信息
- 独立开发者/技术写作者:追踪技术调研过程,整理实验记录和结论
- research-assistant 现有用户:希望扩展笔记分析能力,形成完整工具链
- 隐私敏感型用户:拒绝云端笔记服务,坚持本地优先的数据策略
使用风险
- 数据可用性依赖:若
research_db.json文件被移动、损坏或权限变更,工具将无法正常读取 - research-assistant 强耦合:单独使用价值有限,需前置配合 research-assistant 积累笔记数据
- 关键词质量波动:笔记写作风格直接影响提取效果,口语化、缩写过多会导致关键词无意义
- 无备份机制:工具本身不提供数据备份功能,用户需自行管理数据库文件安全
- 扩展性天花板:纯标准库实现虽保证安全,但也限制了高级功能(如向量化检索、语义搜索)的演进空间