aister-vector-memory

使用说明

核心用法

Vector Memory Skill 为 Aister AI 助手提供基于语义的长期记忆能力。用户通过 /search_memory <query>> 命令以自然语言查询历史记录，系统使用 e5-large-v2 模型将查询转换为 1024 维向量，在 PostgreSQL 数据库中通过余弦相似度匹配最相关的记忆片段。/reindex_memory 命令用于重新索引本地记忆文件（MEMORY.md、IDENTITY.md、USER.md 等），确保向量数据库与最新内容同步。

显著优点

语义理解能力：突破传统关键词匹配的局限，支持"找相似意思而非相同词语"的检索方式，大幅提升信息召回率。本地化部署：数据完全存储在用户控制的 PostgreSQL 数据库中，无云端依赖，隐私可控。双语支持：e5-large-v2 模型原生支持俄语和英语，适合多语言场景。性能优异：单次查询约 1 秒完成（嵌入生成+向量检索），满足实时交互需求。架构清晰：Flask 微服务解耦嵌入生成与存储检索，便于扩展和维护。

潜在缺点与局限性

首次部署成本：需下载 1.3GB 模型文件，对网络环境和存储空间有要求。基础设施依赖：必须自行部署 PostgreSQL 并安装 pgvector 扩展，技术门槛高于纯文件方案。语言局限：仅优化支持俄英双语，中文等其他语言效果未经验证。无版本控制：向量数据库与源文件可能不同步，依赖用户手动触发 reindex。调参敏感：相似度阈值（默认 0.5）和分块大小（500 字符）需根据实际数据调优。

适合的目标群体

开发具备长期记忆能力的 AI 助手的技术团队
需要本地化、隐私优先的 RAG（检索增强生成）方案的用户
俄语/英语场景下的知识管理应用开发者
已有 PostgreSQL 技术栈、希望快速集成向量能力的企业

使用风险

依赖项风险：sentence-transformers 等依赖未锁定版本，可能因上游更新导致兼容性问题。数据泄露风险：记忆文件若包含 API 密钥等敏感信息，将被索引至数据库，需提前清理。权限配置风险：数据库密码通过环境变量传递，配置不当可能导致未授权访问。资源占用：模型缓存约 2.5GB，对边缘设备内存压力较大。

database data-analytics ai-ml backend productivity development-engineering

aister-vector-memory 内容

手动下载zip · 13.7 kB

embedding_service.pytext/plain

请选择文件