🗣 每日羊毛线报 👈🏵 MMaDA - 多模态扩散语言模型
🍥 简介:
MMaDA 是一系列多模态扩散基础模型,旨在文本推理、多模态理解和文本到图像生成等领域实现卓越性能。它采用统一的扩散架构,无需特定模态组件;引入混合长链思维 (CoT) 微调策略,统一跨模态的 CoT 格式;采用统一的基于策略梯度的 RL 算法 UniGRPO,利用多样化的奖励建模,统一推理和生成任务的后训练,确保性能持续提升。已开源 MMaDA-8B-Base 模型。
🍭 #多模态 #扩散模型 #语言模型🎈 【进入项目】🎯 关注频道 🤖 合作/投稿