中科大计算机学习课
中科大计算机学习课
这个项目是基于CogVideoX结构修改的pipeline旨在提供更灵活的生成方式可以用于创建AI图像和视频也可以用于训练Diffusion Transformer的基线模型和Lora模型。
项目的核心优势包括:
– 支持不同分辨率的视频生成从256x256x49到1024x1024x49。
– 支持从已训练的CogVideoX-Fun模型直接进行预测用户可以训练自己的基线模型和Lora模型来实现一定的风格转换。
– 支持从不同平台快速拉起参考Quick Start。
应用场景包括:
– 视频生成:可以生成不同分辨率的视频从256x256x49到1024x1024x49。
– 图像生成:可以生成AI图像。
– 模型训练:可以训练Diffusion Transformer的基线模型和Lora模型。
相关项目包括:
– CogVideo:一个视频生成框架。
– EasyAnimate:一个动画生成框架。