qwen-image · COCOLOOP

使用说明

核心用法

Qwen-Image Skill 是一款基于阿里云百炼平台的双模型文生图工具，通过智能场景识别自动选择最优模型。用户只需配置 DASHSCOPE_API_KEY 环境变量，即可通过命令行快速生成高质量图像。工具支持三种模式：自动模式（根据提示词智能识别场景，人像类自动调用 z-image-turbo，通用类调用 qwen-image-max）、强制指定模式（通过 --model 参数手动选择），以及提示词扩展模式（--prompt-extend 自动优化描述）。

显著优点

智能双模型架构是最大亮点：Z-Image 专精人像摄影，支持胶片质感与真实皮肤细节；Qwen-Image 擅长复杂中文文字渲染与艺术风格创作，完美解决 AI 生图中文字乱码痛点。纯标准库实现确保零依赖负担，仅使用 Python 内置的 http.client、argparse 等模块，避免了第三方包版本冲突。此外，工具提供 6 种预设尺寸比例（16:9 至 9:16），覆盖从横屏壁纸到竖屏人像的全场景需求。

潜在局限性

作为 T3 来源的个人开发者作品，代码虽开源但缺乏企业级维护背书。功能上目前仅支持命令行交互，无图形界面，对非技术用户门槛较高。地域限制明显：阿里云百炼的北京与新加坡节点 API Key 不互通，跨国使用需重新配置。此外，生成依赖稳定的阿里云网络连接，离线环境无法使用，且按调用量计费，高频使用需关注成本。

目标群体

适合开发者快速集成文生图能力至工作流，内容创作者进行批量配图生成，设计师制作含中文文字的图文素材，以及摄影爱好者探索胶片风格人像创作。尤其对需要生成带中文对联、标语、漫画对话框等复杂文字场景的用户，相比国际模型具有显著优势。

使用风险

主要风险集中于API Key 管理：若通过 TOOLS.md 存储密钥，需严格设置文件权限（建议 600），避免提交至 Git 仓库导致泄露。网络传输虽使用 HTTPS，但数据需上传至阿里云服务器，对数据隐私敏感场景需谨慎。本地文件写入需确保输出目录有写权限，避免权限错误。此外，提示词长度限制（正向 ≤800 字符）可能影响超复杂场景的描述精度。

image-gen content-media api automation productivity

qwen-image 内容

scripts文件夹

手动下载zip · 5.9 kB

generate.pytext/plain

请选择文件