文生视频大模型-神华能源报

通版阅读请点击：

展开通版

收缩通版

当前版：04版

首版上一版下一版末版

发布日期:

字体：

放大

缩小

默认

朗读

文生视频大模型

　　4月27日，2024中关村论坛年会上首次发布我国自研的具“长时长、高一致性、高动态性”特点的文生视频大模型Vidu。这一视频大模型由清华大学联合北京生数科技有限公司共同研发，可根据文本描述直接生成长达16秒、分辨率高达1080P的高清视频内容。
　　【知识点】
　　Vidu是自Sora发布之后全球率先取得重大突破的视频大模型。与Sora一致，Vidu能够根据提供的文本描述直接生成长达16秒的高质量视频。除了在时长方面的突破外，Vidu在视频效果方面实现显著提升，主要体现在模拟真实物理世界、多镜头语言、时空一致性高、理解中国元素等方面。
　　在动态性方面，Vidu能生成复杂的动态镜头，不再局限于简单的推、拉、移等固定镜头，而是能在一段画面里实现远景、近景、中景、特写等不同镜头的切换，包括能直接生成长镜头、追焦、转场等效果。
　　【函电贺词】
　　当前，互联网、大数据、云计算、人工智能、区块链等新技术深刻演变，产业数字化、智能化、绿色化转型不断加速，智能产业、数字经济蓬勃发展，极大改变全球要素资源配置方式、产业发展模式和人民生活方式。
　 ——2023年9月4日，习近平致2023中国国际智能产业博览会的贺信

分享到微信 QQ好友 QQ空间新浪微博