Z?Image (造相)是阿里巴巴通義實(shí)驗(yàn)室(Tongyi?MAI)在 2025 年開(kāi)源的高效圖像生成基礎(chǔ)模型,代碼托管在github。模型規(guī)模約 60 億參數(shù),采用 單流 Diffusion Transformer(DiT)? 架構(gòu),將文本理解與圖像生成統(tǒng)一在同一網(wǎng)絡(luò)中,實(shí)現(xiàn)了“思考?生成”一體化的工作流。
- Z-Image開(kāi)源項(xiàng)目官網(wǎng)入口網(wǎng)址:https://github.com/Tongyi-MAI/Z-Image
- modelscope網(wǎng)址:https://www.modelscope.cn/models/Tongyi-MAI/Z-Image-Turbo
- Hugging Face網(wǎng)址:https://huggingface.co/Tongyi-MAI/Z-Image-Turbo

通過(guò) Decoupled?DMD(Distribution Matching Distillation)? 技術(shù),Z?Image?Turbo 版本在僅 8 步(8 NFE)? 推理下即可生成高質(zhì)量、逼真的照片級(jí)圖像,推理時(shí)間常在亞秒級(jí),顯著優(yōu)于同類(lèi)大模型。模型特別擅長(zhǎng) 中英文雙語(yǔ)文本渲染,能夠在圖像中準(zhǔn)確呈現(xiàn)復(fù)雜的中文字符,這在開(kāi)源圖像生成模型中極為罕見(jiàn)。
Z?Image 提供了多種變體:
- Z?Image?Base:原始基線模型,適合研究與二次開(kāi)發(fā);
- Z?Image?Turbo:輕量蒸餾版,兼顧速度與質(zhì)量,適合商業(yè)化部署;
- Z?Image?Edit:支持圖像編輯與局部修改的擴(kuò)展模型。
項(xiàng)目配套了官方文檔、在線 Demo(Hugging Face、ModelScope)? 以及 托管 API 服務(wù),用戶(hù)只需幾行代碼即可調(diào)用模型生成圖像,廣泛用于創(chuàng)意設(shè)計(jì)、內(nèi)容創(chuàng)作、營(yíng)銷(xiāo)素材、電子商務(wù)攝影等場(chǎng)景。
Z?Image 通過(guò)參數(shù)壓縮與架構(gòu)創(chuàng)新,實(shí)現(xiàn)了 高效、低成本、易部署 的圖像生成解決方案,既滿(mǎn)足科研實(shí)驗(yàn)的可復(fù)現(xiàn)需求,也為企業(yè)級(jí)應(yīng)用提供了快速、可靠的視覺(jué)內(nèi)容生產(chǎn)工具。




