**直接偏好优化(DPO)**是一种将文本到图像的Stable Diffusion扩散模型与人类文本偏好对齐的方法。它通过直接优化基于人类比较的数据来调整模型,使其更好地符合人类的偏好。DPO 擅长通过对模型进行微调,将模拟人类偏好的数据有效地整合进模型中,从而提升生成结果的质量和相关性。
模型列表
ClearVAE_V2.3_fp16.safetensors
sd_v15_dpo_lora_v1.safetensors
sd_v15_unet_dpo_offset_v1.safetensors
sd_xl_dpo_lora_v1.safetensors
sd_xl_unet_dpo_offset_v1.safetensors
发表评论