smart-router

🧭 智能模型路由与成本优化专家

🥥4总安装量 2评分人数 2
100% 的用户推荐

基于2026年基准测试的智能模型路由系统,自动为代码、分析、创意等任务选择最优AI模型,支持Claude/GPT/Gemini/Grok四大家族,具备成本优化与故障自动切换能力。

A

基本安全,请在特定环境下使用

  • 来自社区或个人来源,建议先隔离验证
  • ✅ 无动态代码执行风险:未使用eval/exec/system/subprocess等危险函数,无网络代码下载执行
  • ✅ 数据隐私保护完善:四级数据分类机制,敏感数据自动检测与阻止,API密钥仅通过环境变量读取
  • ✅ 输入验证多层防护:长度限制、Unicode规范化、控制字符剥离、白名单模型覆盖验证
  • ⚠️ T3来源需关注维护:个人开发者项目,建议企业用户fork后自主维护更新
  • ⚠️ 多厂商API密钥管理:涉及4家AI服务商,需确保密钥安全存储与定期轮换

使用说明

核心用法

A.I. Smart-Router 是一个透明的智能模型路由中间件,用户无需学习任何特殊指令即可使用。系统通过三层决策架构自动分析请求:第一层识别意图类型(代码/分析/创意/实时/通用),第二层评估复杂度(简单/中等/复杂),第三层处理特殊覆盖场景(超长上下文、实时数据需求、用户显式指定)。支持 [show routing]] 查看路由决策,也可通过 use claude:: 等前缀强制指定模型。

显著优点

智能化程度极高:基于语义域检测而非简单关键词匹配,能识别混合意图任务并自动升级至最高能力模型。超长上下文保护机制在超过15万token时自动切换至Gemini Pro(100万上下文),避免任务失败。

成本优化精细:建立四级成本体系($到$$$$),简单任务强制限定在Flash/Haiku等低价模型,复杂任务才启用Opus/GPT-5,从源头杜绝"用大炮打蚊子"。

容错机制完善:熔断器防止级联故障,速率限制避免预算失控,token耗尽时自动降级并透明通知用户,支持流式响应的中途故障恢复。

安全设计周全:四级数据分类(PUBLIC/INTERNAL/CONFIDENTIAL/RESTRICTED)、敏感数据自动检测、API密钥绝不硬编码、错误信息脱敏处理。

潜在缺点与局限性

实时任务存在单点风险:Grok是唯一实时数据源,若XAI服务故障且无备用实时源,实时查询将降级为普通模型并丢失时效性。

T3来源维护不确定性:个人开发者项目,长期更新承诺需观察,企业级部署建议fork后自主维护。

配置复杂度较高:需同时管理多厂商API密钥,auth profiles配置对新手不够友好,调试路由决策需要一定学习成本。

中文优化待验证:虽声称支持100+语言,但意图检测关键词库以英文为主,复杂中文表达的意图识别准确率可能下降。

适合的目标群体

  • 多模型AI团队:已订阅多个AI服务,希望统一入口并优化成本的技术团队
  • 长文档处理场景:法律、科研、金融等需要处理百万token级文档的专业领域
  • 成本敏感型应用:C端产品或大规模内部工具,需严格控制AI调用成本
  • 高可用要求场景:不能容忍单模型故障导致服务中断的生产环境

使用风险

性能风险:模型自动切换增加首次响应延迟(需检测可用性),流式响应需等待首chunk确认才输出,极端情况下延迟可达10秒以上。

依赖风险:强依赖外部AI服务商稳定性,若Anthropic/Google/OpenAI/XAI同时出现区域性故障,系统将完全不可用(虽概率极低)。

成本失控风险:自动降级机制可能将复杂任务路由至低价但能力不足模型,导致多次重试反而增加总成本;实时任务强制使用Grok可能产生意外高额账单。

数据合规风险:自动路由可能将敏感数据发送至用户未预期的模型(如欧盟数据被路由至美国服务商),需配合数据分类功能谨慎配置。

smart-router 内容

文件夹图标references文件夹
手动下载zip · 76.9 kB
models.mdtext/markdown
请选择文件