qwen-image

🎨 阿里云双模型智能文生图

🥥73总安装量 19评分人数 24
100% 的用户推荐

阿里云百炼官方API驱动的文生图工具,智能双模型切换,擅长中文渲染与胶片感人像,配置API Key即开即用。

A

基本安全,请在特定环境下使用

  • 来自社区或个人来源,建议先隔离验证
  • ✅ 代码安全规范,无危险函数调用(eval/exec/subprocess等高危函数均未使用)
  • ✅ 网络请求仅连接阿里云官方API(dashscope.aliyuncs.com),使用标准HTTPS加密传输
  • ✅ 无硬编码敏感信息,API Key需用户主动配置环境变量或TOOLS.md文件
  • ⚠️ 来源为T3级个人开发者(irron),虽通过安全审计但建议审查代码后使用
  • ⚠️ API Key可从TOOLS.md文件读取,需确保文件权限设置正确(建议chmod 600)

使用说明

核心用法

Qwen-Image Skill 是一款基于阿里云百炼平台的双模型文生图工具,通过智能场景识别自动选择最优模型。用户只需配置 DASHSCOPE_API_KEY 环境变量,即可通过命令行快速生成高质量图像。工具支持三种模式:自动模式(根据提示词智能识别场景,人像类自动调用 z-image-turbo,通用类调用 qwen-image-max)、强制指定模式(通过 --model 参数手动选择),以及提示词扩展模式(--prompt-extend 自动优化描述)。

显著优点

智能双模型架构是最大亮点:Z-Image 专精人像摄影,支持胶片质感与真实皮肤细节;Qwen-Image 擅长复杂中文文字渲染与艺术风格创作,完美解决 AI 生图中文字乱码痛点。纯标准库实现确保零依赖负担,仅使用 Python 内置的 http.clientargparse 等模块,避免了第三方包版本冲突。此外,工具提供 6 种预设尺寸比例(16:9 至 9:16),覆盖从横屏壁纸到竖屏人像的全场景需求。

潜在局限性

作为 T3 来源的个人开发者作品,代码虽开源但缺乏企业级维护背书。功能上目前仅支持命令行交互,无图形界面,对非技术用户门槛较高。地域限制明显:阿里云百炼的北京与新加坡节点 API Key 不互通,跨国使用需重新配置。此外,生成依赖稳定的阿里云网络连接,离线环境无法使用,且按调用量计费,高频使用需关注成本。

目标群体

适合开发者快速集成文生图能力至工作流,内容创作者进行批量配图生成,设计师制作含中文文字的图文素材,以及摄影爱好者探索胶片风格人像创作。尤其对需要生成带中文对联、标语、漫画对话框等复杂文字场景的用户,相比国际模型具有显著优势。

使用风险

主要风险集中于API Key 管理:若通过 TOOLS.md 存储密钥,需严格设置文件权限(建议 600),避免提交至 Git 仓库导致泄露。网络传输虽使用 HTTPS,但数据需上传至阿里云服务器,对数据隐私敏感场景需谨慎。本地文件写入需确保输出目录有写权限,避免权限错误。此外,提示词长度限制(正向 ≤800 字符)可能影响超复杂场景的描述精度。

qwen-image 内容

文件夹图标scripts文件夹
手动下载zip · 5.9 kB
generate.pytext/plain
请选择文件