sota-tracker-claw

🏆 AI SOTA 模型权威数据追踪器

🥥31总安装量 11评分人数 14
100% 的用户推荐

聚合 LMArena 等权威平台的 SOTA AI 模型追踪器,每日自动更新并提供 JSON/API 接口,助力开发者精准选型。

A

基本安全,请在特定环境下使用

  • 来自社区或个人来源,建议先隔离验证
  • ✅ 代码通过安全审计,无 eval/exec/system 等危险函数调用风险
  • ✅ 采用参数化 SQL 查询与严格输入验证,有效防范注入攻击与越界访问
  • ✅ 依赖版本已锁定,无动态代码下载或远程加载行为,供应链安全可控
  • ⚠️ 来源为 T3 级别社区项目(个人开发者维护),需关注长期维护可持续性
  • ⚠️ 需要网络访问 LMArena/HuggingFace 等外部 API 获取最新数据,存在网络依赖风险

使用说明

核心用法

SOTA Tracker 提供五种灵活的数据获取方式,满足不同场景需求:静态文件下载可直接获取 JSON/CSV 格式的完整数据集;本地 SQLite 查询支持复杂 SQL 筛选和自定义分析;Claude Code 集成通过嵌入 CLAUDE.md 实现低 Token 成本的实时查询;REST API 提供标准化的 HTTP 接口便于服务集成;MCP Server 为兼容的 AI 助手提供原生工具调用能力。数据覆盖 LLM、图像生成、视频合成、语音处理等 9 大类别,包含 Elo 排名、基准测试、定价等多维度指标。

显著优点

该项目最大优势在于数据权威性与时效性的完美结合。通过自动化 GitHub Actions 每日抓取 LMArena(600 万+人类投票)、Artificial Analysis、HuggingFace 等顶级数据源,确保排名反映最新市场格局。独特的 "forbidden" 过期模型清单功能有效避免开发者选用已淘汰方案。技术架构设计合理,提供从静态文件到动态 API 的完整谱系,既支持离线批处理又支持实时查询,且针对 Claude Code 优化的静态嵌入方案显著降低使用成本。

潜在缺点与局限性

作为 T3 级别的社区项目,其长期维护稳定性存在不确定性,目前依赖个人开发者账号(romancircus)维护。功能层面,网络强依赖是主要限制——无论是每日数据更新还是实时 API 调用均需访问外部服务,完全离线环境无法获取最新数据。MCP 模式虽然功能强大,但文档明确提示其 Token 消耗高于静态嵌入方案。此外,爬虫依赖 Playwright 等重型库,本地部署时环境配置相对复杂。

适合的目标群体

该工具特别适合AI 技术选型决策者(架构师、技术负责人)、AI 应用开发者(需要对比模型性能与成本)、学术研究人员(追踪领域最新进展)以及Claude Code 重度用户(通过 CLAUDE.md 集成获得上下文感知的模型推荐)。对于需要构建内部模型评估体系的企业,其标准化的 JSON/SQLite 导出功能可快速集成到现有数据 pipeline 中。

使用风险

主要风险集中在数据源稳定性合规性两方面:若 LMArena 或 HuggingFace 更改 API/robots.txt 策略,自动更新可能中断;虽然项目声明符合合理使用原则并尊重 robots.txt,但大规模商业部署时仍需关注数据源平台的服务条款变更。技术风险方面,虽代码本身通过安全审计,但 Playwright 浏览器自动化可能因目标网站结构变化而失效,需关注项目更新状态。

sota-tracker-claw 内容

文件夹图标data文件夹
文件夹图标fetchers文件夹
文件夹图标migrations文件夹
文件夹图标scrapers文件夹
文件夹图标scripts文件夹
文件夹图标tests文件夹
文件夹图标utils文件夹
手动下载zip · 110.2 kB
aa_llm_latest.jsonapplication/json
请选择文件