aister-vector-memory

🧠 AI 助手的语义长期记忆引擎

🥥59总安装量 16评分人数 20
100% 的用户推荐

基于 PostgreSQL+pgvector 的本地语义记忆系统,支持俄英双语向量检索,为 AI 助手提供长期上下文记忆能力。

A

基本安全,请在特定环境下使用

  • 来自社区或个人来源,建议先隔离验证
  • ✅ 无危险函数(eval/exec/system/subprocess),代码结构清晰安全
  • ✅ 敏感信息通过环境变量管理,无硬编码凭据,使用参数化查询防 SQL 注入
  • ✅ 文件访问限定白名单(MEMORY_FILES),无路径遍历风险
  • ⚠️ 首次运行需从 HuggingFace 下载模型(~1.3GB),依赖外部网络
  • ⚠️ 依赖版本未完全锁定,建议补充 requirements.txt 版本约束

使用说明

核心用法

Vector Memory Skill 为 Aister AI 助手提供基于语义的长期记忆能力。用户通过 /search_memory <query>> 命令以自然语言查询历史记录,系统使用 e5-large-v2 模型将查询转换为 1024 维向量,在 PostgreSQL 数据库中通过余弦相似度匹配最相关的记忆片段。/reindex_memory 命令用于重新索引本地记忆文件(MEMORY.md、IDENTITY.md、USER.md 等),确保向量数据库与最新内容同步。

显著优点

语义理解能力:突破传统关键词匹配的局限,支持"找相似意思而非相同词语"的检索方式,大幅提升信息召回率。本地化部署:数据完全存储在用户控制的 PostgreSQL 数据库中,无云端依赖,隐私可控。双语支持:e5-large-v2 模型原生支持俄语和英语,适合多语言场景。性能优异:单次查询约 1 秒完成(嵌入生成+向量检索),满足实时交互需求。架构清晰:Flask 微服务解耦嵌入生成与存储检索,便于扩展和维护。

潜在缺点与局限性

首次部署成本:需下载 1.3GB 模型文件,对网络环境和存储空间有要求。基础设施依赖:必须自行部署 PostgreSQL 并安装 pgvector 扩展,技术门槛高于纯文件方案。语言局限:仅优化支持俄英双语,中文等其他语言效果未经验证。无版本控制:向量数据库与源文件可能不同步,依赖用户手动触发 reindex。调参敏感:相似度阈值(默认 0.5)和分块大小(500 字符)需根据实际数据调优。

适合的目标群体

  • 开发具备长期记忆能力的 AI 助手的技术团队
  • 需要本地化、隐私优先的 RAG(检索增强生成)方案的用户
  • 俄语/英语场景下的知识管理应用开发者
  • 已有 PostgreSQL 技术栈、希望快速集成向量能力的企业

使用风险

依赖项风险:sentence-transformers 等依赖未锁定版本,可能因上游更新导致兼容性问题。数据泄露风险:记忆文件若包含 API 密钥等敏感信息,将被索引至数据库,需提前清理。权限配置风险:数据库密码通过环境变量传递,配置不当可能导致未授权访问。资源占用:模型缓存约 2.5GB,对边缘设备内存压力较大。

aister-vector-memory 内容

手动下载zip · 13.7 kB
embedding_service.pytext/plain
请选择文件