该 Skill 为用户提供通过 OpenRouter 平台调用 Nano Banana Pro(Gemini 3 Pro Image Preview)模型生成高质量图像的能力。它采用 Shell 脚本封装,支持从 1K 到 4K 的多种分辨率输出,并内置了"草稿-迭代-定稿"的科学工作流,帮助用户在确认提示词效果后再生成高分辨率成品,有效节省时间和成本。
核心用法上,用户通过调用 generate_image.sh 脚本并传入 --prompt 参数描述图像需求,可选择 --resolution 指定 1K/2K/4K 分辨率,使用 --filename auto 自动生成带时间戳的文件名。脚本会自动处理 API 请求、图像解码和本地存储,输出路径固定于 ~/.openclaw/workspace/outputs/nano-banana-pro-openrouter 目录,确保文件管理有序。API Key 和 Base URL 可通过环境变量或 .env 文件灵活配置。
显著优点包括:首先,分级工作流设计(1K 快速预览 → 提示词调优 → 4K 最终输出)大幅降低了迭代成本;其次,严格的参数白名单验证(仅允许 1K/2K/4K)和路径处理(使用 basename 防止目录遍历)确保了操作安全;再者,依赖仅使用系统标准工具(curl、base64),无外部包管理器依赖,部署轻量;最后,自动文件名生成和明确的错误提示提升了用户体验。
潜在局限性方面,当前 Shell 版本仅支持文生图,不支持图生图编辑功能;必须依赖 OpenRouter 外部服务,无法离线使用;作为 T3 来源(个人开发者账号)的社区项目,长期维护稳定性相对较弱;且仅针对 Nano Banana Pro/Gemini 3 Pro Image 模型优化,模型选择灵活性不足。
适合群体主要包括:需要批量生成高质量 AI 图像的内容创作者、希望通过 API 自动化图像生成流程的开发者、以及对图像分辨率有明确要求(如需要 4K 商用级输出)的设计师和营销人员。特别适合已拥有 OpenRouter API 访问权限的用户。
使用风险需注意:用户需自行妥善保管 API Key,虽然 Skill 本身不硬编码密钥,但建议通过 .env 文件而非命令行参数传递以避免历史记录泄露;图像生成依赖网络连接和 OpenRouter 服务可用性;所有提示词和生成的图像元数据会传输至 OpenRouter 服务器,对隐私敏感场景需谨慎评估;此外,4K 图像生成消耗较多 API 配额,需注意成本控制。