sinancodesinancode

Z-Image

Z-Image是阿里巴巴通义实验室开源的轻量级AI图像生成模型,具备照片级真实感、中英双语文本精准渲染能力,可在消费级显卡上实现亚秒级高效出图。

输入
生成结果

提交表单后,生成结果将显示在这里

什么是Z-Image

Z-Image是阿里通义实验室推出的6B参数轻量型AI图像生成模型,采用创新的S³-DiT单流扩散Transformer架构,目前已开源Z-Image-Turbo蒸馏极速版,同时即将发布Base基础版和Edit编辑版。该模型仅需8步采样即可生成高质量图像,权重文件仅24GB,16GB显存的消费级显卡就能流畅运行,在Hugging Face发布首日便登顶趋势榜,具备媲美20B+参数模型的图像真实感与细节还原度。Z-Image系列包含三个版本,分别面向极速出图、二次开发和图像编辑等不同需求,适配Hugging Face、ComfyUI等主流生态,同时阿里云ModelStudio也提供对应的API服务。

版本说明

免费版

基于 Hugging Face 开源模型部署,适合体验模型能力。由于使用共享资源,服务可能不稳定,生成速度较慢,仅支持基础参数设置。

标准版

基于阿里云 API 部署,提供稳定可靠的生成服务。支持更多参数调节,生成速度更快,适合正式使用场景。

为什么选择Z-Image

低算力门槛

16GB显存即可运行,RTX 3060等消费级显卡也能部署,无需顶级GPU硬件,大幅降低使用成本

高效出图能力

Turbo版本仅需8步采样,可实现亚秒级推理,RTX 4090显卡上2.3秒即可生成一张高清图,提升创作效率

卓越生成质量

能实现照片级真实感,精准还原发丝纹理、金属反光、布料褶皱等细节,同时在人脸真实感与整体画面美感上表现优异

双语文本渲染

可精准处理中英文混合文本及小字号、复杂排版场景,解决传统AI生图的文字崩坏难题

强大语义理解

内置提示增强器,具备世界知识与多元文化理解能力,可处理古诗可视化、复杂逻辑指令等特殊需求

开源可定制

采用Apache 2.0许可,Base版本支持开发者进行微调与定制开发,满足多样化的场景需求

Z-Image适用场景

电商领域

快速生成商品宣传图、详情页海报,支持添加精准的中英文产品说明文字,提升商品展示效果

广告创作

批量产出社交媒体广告、线下横幅海报等素材,兼顾画面美感与文案信息的清晰呈现

艺术创作

帮助艺术家生成插画、概念设定、独特艺术作品,探索多元创作风格与主题

影视游戏开发

辅助生成虚拟场景、角色形象、道具模型等数字资产,加速影视特效与游戏开发流程

教学素材制作

生成历史场景、科学现象等教学相关图像,增强教学内容的直观性与趣味性

设计原型产出

快速将设计想法转化为可视化原型,支持后续的修改与优化,提升设计迭代效率

如何使用Z-Image

使用步骤

1

环境准备

准备16GB显存以上的显卡,安装PyTorch、Transformers、Diffusers等相关依赖,建议从源码安装最新版本diffusers以获得完整支持

2

获取权重

从Hugging Face的tongyi-mai/z-image-turbo仓库或ModelScope平台下载Z-Image-Turbo的模型权重

3

模型调用

通过Diffusers库加载模型,设置相关参数后输入提示词即可生成图像,也可启用Flash Attention提升运行效率

4

工作流集成

将Z-Image-Turbo导入ComfyUI,配合ControlNet、LoRA等插件,实现更精准的图像生成与控制

5

API调用

通过阿里云ModelStudio平台调用Z-Image的API服务,无需本地部署即可实现高效生图

简单调用示例

可通过Python代码快速实现图像生成,先加载ZImagePipeline并配置模型权重,再输入自定义提示词,设置采样步数、图像尺寸等参数后,即可生成并保存图像,具体可参考官方提供的代码示例,支持调整生成种子以获取不同效果。

立即体验Z-Image

无需复杂部署,即可快速感受亚秒级出图与精准文本渲染的强大能力

进入Z-Image在线生成工具

Z-Image常见问题

Z-Image目前有哪些可用版本

目前仅Z-Image-Turbo蒸馏极速版已开源可下载使用,Z-Image-Base基础版和Z-Image-Edit编辑版暂未发布,后续将陆续开放获取渠道。

Z-Image对硬件的最低要求是什么

Z-Image-Turbo版本在16GB显存显卡上可流畅运行,同时也支持RTX 3060 6GB等更低配置的消费级显卡,仅会出现一定程度的速度下降,满足不同硬件条件用户的使用需求。

Z-Image的文本渲染能力有局限吗

Z-Image可精准处理常规的中英文文本及复杂排版,但在极端艺术字、特殊字体等场景下可能出现瑕疵,建议这类场景结合专业设计工具进行后期优化。

Z-Image是否支持图生图和图像编辑

当前的Turbo版本主要面向文生图场景,专门的图生图与图像编辑功能将由即将发布的Z-Image-Edit版本提供,该版本可按自然语言指令修改图像背景、姿态、文字等内容,并保持身份与光照的一致性。

Z-Image的开源许可是什么,可用于商业场景吗

Z-Image采用Apache 2.0开源许可,允许用于商业场景和二次开发,开发者可基于Base版本进行定制化微调,只需遵守相关开源协议即可。

Z-Image 免费在线使用 - 阿里通义开源AI图像生成模型