Z-Image

Z-Imageはアリババ通義研究所が開発したコスパ抜群のAI画像ジェネレーターで、超高速推論とお手頃な価格が特徴です。アジア人ポートレートに特化し、より自然な顔の特徴と肌の色合いを実現します。

入力
生成結果
履歴を見る

フォームを送信すると、生成結果がここに表示されます

Showcase

3x3 九宫格拼贴画,带有粗白色边框线。 每格中显示的是人像,人像是日本动漫海贼王中的路飞,9 种不同的摄像角度

Showcase

九宫格构图,带有粗白色边框线,同一个写实风格的亚洲成年女性人像,保持拍摄方向为正面平视视角,人物的表情与姿态保持一致,画面统一为柔和的自然光,背景是干净的浅灰色纯色背景,9 个格子分别对应 9 种不同的发型:1. 黑长直中分长发、2. 羊毛卷齐肩短发、3. 高扎元气马尾辫、4. 空气刘海齐耳短发、5. 法式慵懒大波浪长发、6. 利落干净的超短发、7. 温柔低盘发、8. 俏皮双麻花辫、9. 层次感碎发中长发,整体画面清晰高清,光影自然柔和,无多余元素

Showcase

超现实主义 3x3 九宫格拼贴画,带有粗白色边框线。 背景展示了[穿着西装的小鸟]的不同可爱姿势、角度和景别的照片(打哈欠、睡觉、玩耍、歪头、爪子)。中间网格隐藏。 顶层覆盖 了一只巨大的、超写实的、全身3D剪纸风格的同一只[穿着西装的小鸟],正俏皮地从网格中向前跳Et。 所有元素清晰锐利,深景深f/16(全焦段清晰),无背景虚化,明亮的柔光箱布光以突显毛发质感,触感真实的毛绒细节,强烈的3D 跃出屏幕效果。

Showcase

超现实主义 3x4 十二宫格拼贴画,带有粗白色边框线。 背景展示了[穿着西装的小狗]的不同可爱姿势、角度和景别的照片(打哈欠、睡觉、玩耍、歪头、爪子)。中间网格隐藏。 顶层覆盖 了一只巨大的、超写实的、全身3D剪纸风格的同一只[穿着西装的小狗],正俏皮地从网格中向前跳Et。 所有元素清晰锐利,深景深f/16(全焦段清晰),无背景虚化,明亮的柔光箱布光以突显毛发质感,触感真实的毛绒细节,强烈的3D 跃出屏幕效果。

Showcase

一位迷人的赛车女郎(亚洲面孔)站在高性能 F1 赛车旁,下身穿泳裤,上身穿低胸外套,外套上印刷着“sinancode.com”,真实的皮肤纹理,错综复杂的细节,景深效果,2k 分辨率,电影级布光,索尼 A7R IV 拍摄,85mm 镜头。

Showcase

一位迷人的赛车女郎(亚洲面孔)站在高性能 F1 赛车旁,下身穿泳裤,上身穿低胸外套,外套上印刷着“sinancode.com”,真实的皮肤纹理,错综复杂的细节,景深效果,2k 分辨率,电影级布光,索尼 A7R IV 拍摄,85mm 镜头。

Z-Imageとは

Z-Imageはアリババ通義研究所が開発した60億パラメータのコスパ抜群AI画像ジェネレーターで、効率とコスト管理を重視するユーザー向けに設計されています。革新的なS³-DiT アーキテクチャに基づき、わずか8ステップのサンプリングで高品質画像を生成し、FluxなどのAPIコストの1/3で利用可能です。豊富なアジア人顔データで学習されたZ-Imageは、より正確な顔の輪郭、自然な肌の色合い、バランスの取れた容姿のアジア人ポートレート生成に優れています。オープンソースのTurboバージョンはHugging Face、ComfyUI、アリババクラウドModelStudio APIサービスに対応しています。

バージョンオプション

無料版

Hugging Faceのオープンソースモデルを使用してデプロイされ、モデルの性能を試すのに最適です。共有リソースのためサービスが不安定になる場合があり、生成速度が遅く、基本的なパラメータオプションのみ利用可能です。

スタンダード版

アリババクラウドAPIを通じてデプロイされ、安定かつ信頼性の高い生成サービスを提供します。より多くのパラメータ調整に対応し、生成速度も速く、本番環境での使用に適しています。

Z-Imageを選ぶ理由

超低コスト

Flux、Midjourneyなどの主要モデルの1/3のAPI価格。同じ予算で3倍の画像を生成でき、大量画像生成に最もお得です

超高速出力

Turboバージョンはわずか8ステップのサンプリングで1秒未満の推論を実現。RTX 4090で1枚あたり2.3秒、Flux Proの2〜3倍高速です

アジア人ポートレート最適化

アジア人の顔に特化して学習データを最適化。生成されたアジア人ポートレートは、より正確な顔の輪郭、自然な肌の色合い、バランスの取れた容姿を実現し、不自然なAI感を排除します

バイリンガルテキスト描画

中国語・英語混在テキストや複雑なレイアウトの描画に優れ、従来のAI画像ジェネレーターに共通するテキスト歪み問題を解決します

低いハードウェア要件

RTX 3060など16GB VRAMの一般向けGPUで動作し、高価な業務用ハードウェアは不要です

オープンソース商用利用可

Apache 2.0ライセンスで、商用利用や二次開発が無料。追加のライセンス料は不要です

Z-Imageの活用シーン

アジア人ポートレート撮影

SNSアイコン、証明写真モックアップ、キャラクター素材に使える自然でリアルなアジア人ポートレートを生成。顔のディテールは実際の写真に匹敵します

EC向け大量生成

商品画像やモデル写真を低コストで大量生成。同じ予算で3倍の素材を作成でき、大量の画像が必要な販売者に最適です

動画サムネイル

目を引く動画サムネイルを高速・低コストで生成。日常的に大量のコンテンツを制作するクリエイターに最適です

広告クリエイティブテスト

低コストで複数の広告クリエイティブバージョンを素早く作成しA/Bテストを実施、最適なコンセプトを絞り込みます

SNS運用

ブログ、Instagram投稿、Twitterグラフィックなどの画像を大量生成し、日々のコンテンツ制作コストを削減します

個人のクリエイティブ練習

AIアートへの参入障壁が低く、予算を抑えてAI画像生成を学び探求したい方に最適です

Z-Imageの使い方

利用手順

1

環境準備

16GB以上のVRAMを搭載したGPUを用意し、PyTorch、Transformers、最新版のDiffusersなどの依存関係をインストールします

2

モデルウェイトの取得

Hugging Faceリポジトリ(tongyi-mai/z-image-turbo)またはModelScopeプラットフォームからZ-Image-Turboのウェイトをダウンロードします

3

モデル推論

Diffusersライブラリでモデルを読み込み、カスタマイズしたパラメータとプロンプトを入力して画像を生成し、Flash Attentionで高速化します

4

ワークフロー統合

Z-Image-TurboをComfyUIにインポートし、ControlNetやLoRAなどのプラグインと組み合わせて精密な画像制御を行います

5

APIアクセス

アリババクラウドModelStudioを通じてZ-ImageのAPIを呼び出し、ローカルデプロイなしでクラウド上で画像を生成します

簡単なコード例

Pythonを使って素早く画像を生成します:モデルウェイトでZImagePipelineを読み込み、カスタムプロンプトを入力し、サンプリングステップと画像サイズを設定して、出力を生成・保存します。ランダムシードを調整して異なる結果を得ることができ、詳細なパラメータ設定は公式サンプルを参照してください。

Z-Imageを今すぐ試す

低コスト、高速出力、自然なアジア人ポートレート — 1/3の価格で3倍の出力を実現

Z-Imageオンラインジェネレーターにアクセス

Z-Image よくある質問

Z-Imageの現在利用可能なバージョンは?

現在、Z-Image-Turbo(蒸留高速バージョン)のみがオープンソースでダウンロード可能です。Z-Image-Base(ベースバージョン)とZ-Image-Edit(編集バージョン)はリリース待ちで、公式アクセスチャネルは後日発表予定です。

Z-Imageの最低ハードウェア要件は?

Z-Image-Turboは16GB VRAMのGPUでスムーズに動作し、RTX 3060(6GB VRAM)などの低スペックな一般向けGPUでも若干の速度低下で互換性があり、さまざまなハードウェア環境のユーザーに対応しています。

Z-Imageのテキスト描画機能に制限はありますか?

Z-Imageは通常の中国語・英語テキストや複雑なレイアウトを正確に処理しますが、芸術的なフォントや特殊なタイポグラフィなどの極端なシナリオでは不具合が生じる場合があります。そのような場合はプロのデザインツールでの後処理をお勧めします。

Z-Imageは画像から画像への変換や画像編集機能に対応していますか?

現在のTurboバージョンはテキストから画像への生成に特化しています。画像から画像への変換や編集機能は、今後リリースされるZ-Image-Editで提供される予定で、アイデンティティと照明の一貫性を保ちながら背景、ポーズ、テキストの変更が可能になります。

Z-Imageのオープンソースライセンスは何ですか?商用利用は可能ですか?

Z-ImageはApache 2.0オープンソースライセンスを採用しており、商用利用や二次開発が許可されています。開発者は関連するオープンソース契約に準拠する限り、Baseバージョンをファインチューニングしてカスタマイズできます。