清华发布视频生成大模型视界一粟YiSu
国产Sora来了
2024-06-13
来源:快科技
6月12日消息,据媒体报道,北京极佳视界科技有限公司联合清华大学自动化系正式发布我国首个超长时长、高性价比的Sora级视频生成大模型“视界一粟 YiSu”。
该大模型拥有模型原生的16秒超长时长,并可生成至1分钟以上视频。据介绍,YiSu模型成本更低、速度更快、端侧可用。
年初Sora的爆火,让DiT架构受到了业内极大的关注,很多公司和项目也开始复现DiT路线。
而“视界一粟YiSu”则是基于团队自研的视频生成大模型技术,并没有止步于DiT。该团队融合LLM和扩散模型的自研架构,结合各种路线的优势,在多模态融合、训练效率、推理效率、模型效果等方面达到优化,打造视频生成的方案。
此前,该团队曾提出WorldDreamer,是全球第一次以Transformer和LLM(Masked Token路线)为中心的视频生成工作。
此次发布的视频生成大模型,是YiSu-Beta V0.5版本,YiSu大模型正在按照每周一个小版本、每月一个大版本的迭代速度成长进化。未来几个月,在视频时长、可控性、推理速度、运行成本、理解物理世界等方面还将持续迎来大幅度的提升。
据了解,极佳科技核心团队拥有超过十年的AI技术积累。其团队来自清华大学、中科院、中科大等知名院校,累积发表AI顶级论文200余篇,多次获得全球权威AI比赛世界冠军。
本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。