挖掘有趣 Github 的猫。


有事联系:https://t.me/qumao?direct
🍭 #视频生成 #人工智能模型


🏵 Wan2.2 - 大规模视频生成模型

🍥 简介:
Wan2.2 是一款开源、先进的大规模视频生成模型,采用创新的 Mixture-of-Experts(MoE)架构,提升了模型容量并优化了推理效率,支持文本、图像、语音等多模态驱动的视频生成。模型涵盖720P/24fps高分辨率输出,具备电影级美学风格和复杂动作生成能力,同时适配消费级GPU。Wan2.2 还集成高压缩VAE,显著提升推理速度,方便学术研究及工业应用。支持多种部署方式,已融入 ComfyUI、Diffusers 等主流AI工具链,满足多场景视频创作需求。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🗣 每日羊毛线报 👈


🏵 SkyReels-V2 - 无限长度影片生成模型

🍥 简介:
SkyReels-V2 是一款开源的无限长度影片生成模型,据称是首个采用自回归扩散强制(AutoRegressive Diffusion-Forcing)架构的开源实现。它旨在解决现有模型在视频时长、动作质量、视觉效果与电影化叙事理解上的瓶颈。该项目融合多模态大语言模型(MLLM)、多阶段预训练、强化学习及扩散强制等技术,并通过自研的 SkyCaptioner-V1 进行精细化视频标注。其目标是生成高质量、长时序、强一致性且符合提示的电影风格视频,支持故事生成、图生视频等应用。

🍭 #视频生成 #AI电影


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
#CogVideo #开源 #视频生成


🏵 #程序 | CogVideo - 根据文本生成视频

🍥 简介:
CogVideo 是一个文本到视频生成的模型,基于大规模预训练的 Transformer。它继承了文本到图像生成模型 CogView2 的预训练权重,通过分层学习和多帧率采样的方法,实现了对复杂行为的理解和生成。它是目前最大的、也是第一个开源的文本到视频生成模型,拥有 9.4 亿个参数,在 540 万对文本和视频的数据集上进行了训练。


🎈 【进入项目】


🎯
注频道 🤖 合作/投稿 🗣 赚钱项目
 
 
Back to Top