4月27日,2024中关村论坛年会上首次发布我国自研的具“长时长、高一致性、高动态性”特点的文生视频大模型Vidu。这一视频大模型由清华大学联合北京生数科技有限公司共同研发,可根据文本描述直接生成长达16秒、分辨率高达1080P的高清视频内容。
【知识点】
Vidu是自Sora发布之后全球率先取得重大突破的视频大模型。与Sora一致,Vidu能够根据提供的文本描述直接生成长达16秒的高质量视频。除了在时长方面的突破外,Vidu在视频效果方面实现显著提升,主要体现在模拟真实物理世界、多镜头语言、时空一致性高、理解中国元素等方面。
在动态性方面,Vidu能生成复杂的动态镜头,不再局限于简单的推、拉、移等固定镜头,而是能在一段画面里实现远景、近景、中景、特写等不同镜头的切换,包括能直接生成长镜头、追焦、转场等效果。
【函电贺词】
当前,互联网、大数据、云计算、人工智能、区块链等新技术深刻演变,产业数字化、智能化、绿色化转型不断加速,智能产业、数字经济蓬勃发展,极大改变全球要素资源配置方式、产业发展模式和人民生活方式。
——2023年9月4日,习近平致2023中国国际智能产业博览会的贺信