b3ehive

🐝 三智能体代码竞技优选方案

🥥5总安装量 2评分人数 2
100% 的用户推荐

基于 PCTF 框架的三智能体代码竞赛系统,通过并行生成与交叉评估自动筛选最优实现,提升代码质量与可靠性。

A

基本安全,请在特定环境下使用

  • 来自社区或个人来源,建议先隔离验证
  • ✅ 通过全部 8 项 BSS 安全检测,无 eval/exec/system 等危险函数,无动态代码加载
  • ✅ 严格工作目录隔离(workspace/),所有文件操作受限,无系统破坏性命令
  • ✅ 零敏感数据收集,无网络传输行为,仅依赖标准系统工具(bash/grep/cp 等)
  • ⚠️ T3 个人开发者来源(weiyangzen),建议生产环境使用前进行代码审计
  • ⚠️ 执行期间会创建并修改工作目录文件,需确保 workspace/ 内不含敏感数据

使用说明

b3ehive 是一款基于 PCTF(Purpose-Chain-Task-Format)框架构建的多智能体代码竞赛系统,通过模拟"竞技场"模式解决单一开发任务的质量优化问题。该系统同时启动三个具备不同优化目标的 AI 代理(简洁型、速度型、稳健型),针对同一编程任务并行生成独立实现方案,并通过交叉评估与数据驱动的评分机制,自动筛选出综合最优的解决方案。

核心用法遵循严格的四阶段流程:首先是并行生成阶段(Phase 1: Parallel Spawn),三个代理分别聚焦于简洁性、执行速度和鲁棒性进行独立开发,产出可运行的代码、完成清单及方案摘要;随后进入交叉评估阶段(Phase 2: Cross-Evaluation),每个代理需基于五大维度(简洁性 20%、速度 25%、稳定性 25%、边界情况 20%、可维护性 10%)对其他两个方案进行客观评分并提供数据支撑的评价报告;第三阶段为客观自评(Phase 3: Self-Scoring),各代理依据相同权重体系进行自我打分并给出结论;最终在交付阶段(Phase 4: Final Delivery),系统根据分数差距自动选择单一最优解、混合方案或最简实现,并生成详细的对比报告与决策依据。

该系统的显著优点在于其竞争驱动的质量提升机制——多视角设计天然避免了单一代理的思维局限,五大维度的量化评估体系(涵盖代码复杂度、大 O 分析、错误处理覆盖率等硬性指标)确保了评估的客观性。此外,内置的 Linter 规则(强制代码编译、测试通过、无 TODO、文档完整)和运行时断言机制构成了完整的质量门禁,使输出具备生产环境可用性。

然而,b3ehive 也存在一定局限性。作为T3 来源的个人开源项目,其长期维护稳定性与代码审计深度不如企业级方案;资源消耗较高——同时运行三个高级模型实例(默认使用 GPT-5.3-codex)会带来显著的计算成本;对于高度复杂或创新性极强的架构设计任务,LLM 驱动的交叉评估可能无法完全替代人类专家的主观判断;此外,系统对工作目录的读写操作虽受限于 workspace/ 文件夹,但仍需用户确保该目录不含敏感文件。

该技能最适合追求代码质量标准化的开发团队自动化代码审查流程以及算法竞赛备赛训练等场景。它能有效替代传统的人工代码走查环节,特别适合需要快速获得多个实现方案并进行客观比选的敏捷开发场景。

使用风险主要包括:资源开销风险(三重模型调用成本)、工作区污染风险(自动创建 run_a/b/c 等目录结构)、输入注入风险(虽脚本使用 set -euo pipefail 和引号包裹变量,但任务描述仍应避免包含恶意命令注入)。建议在隔离容器或虚拟机中执行,并定期清理 workspace 目录。

b3ehive 内容

文件夹图标scripts文件夹
文件夹图标templates文件夹
手动下载zip · 12.9 kB
phase1_spawn.shtext/x-shellscript
请选择文件