HunyuanDiT简介
混元-DiT 是一种高性能的多分辨率扩散 Transformer 模型,专注于细粒度的中文理解。作为一种文本到图像的转换器,它能够细致地处理英语和中文文本。该模型设计包括了 Transformer 结构、文本编码器和位置编码。Hunyuan-DiT 在中文文本生成图像的任务中,树立了新的最先进水平。
模型列表(持续更新,建议收藏)
HunyuanDiT-v1.2.safetensors
HunyuanDiT-v1-2_sdxl-vae-fp16-fix.safetensors
dialoggen对话生成器
dialoggen_00003-of-00004.safetensors
dialoggen_00004-of-00004.safetensors
openai_clip-vit-large-patch14-336_model.bin
openai_clip-vit-large-patch14-336_tf_model.h5
中文元素理解
混元DiT提供双语生成能力,中国元素理解具有优势。
发表评论