#MiniGPT4 #开源


🏵 #程序 | MiniGPT-4 - 多模态生成与理解

🍥 简介:
MiniGPT-4是一种视觉-语言模型,它将一个固定的视觉编码器(BLIP-2)和一个固定的大型语言模型(Vicuna)通过一个投影层对齐。它可以根据图像生成详细的文本描述,如网站、故事、诗歌等。MiniGPT-4能够实现类似于GPT-4的多模态能力,例如根据手写文本生成网站,或根据图像写故事和诗歌。


🎈 【进入项目】


🫥 关注频道 🤖 合作/投稿
 
 
Back to Top