生数科技与清华大学联合发布的Vidu,首个长时长、高一致性、高动态性视频大模型

先看视频效果

7月30日,曾于四月底亮相中关村论坛的AI生成视频大模型Vidu正式上线,开放给全球用户使用。Vidu开放文生视频、图生视频两大核心功能,提供4s和8s两种时长选择,分辨率最高达1080P。

生数科技与清华大学联合发布的Vidu,首个长时长、高一致性、高动态性视频大模型

Vidu是北京生数科技有限公司(以下简称生数科技)联合清华大学发布的国内首个自研长时长、高一致性、高动态性视频大模型,该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT,支持一键生成长达16秒、分辨率达1080P的高清视频。

据介绍,此次面向全球上线,Vidu在保持高动态性、高逼真度、高一致性等效果优势的同时,新增了角色一致性(Character To Video)、动漫风格、文字与特效画面生成等特色能力。生数科技方面表示,Vidu实现了业界最快的实测推理速度,生成一段4秒片段仅需30秒。目前Vidu无需申请,用户直接使用邮箱注册即可上手体验。

据介绍,目前业界对类Sora视频模型的评价主要围绕三大核心维度:语义理解准确性、画面美观性、主体动态的一致性。Vidu能够准确理解并生成提示词中的文字,包括字母、数字等,并能生成文字特效。对于第一人称、延时摄影等镜头语言,Vidu也能精准表达,用户只需细化提示词,即可大幅提升视频的可控性。同时,Vidu支持大幅度、精准的动作生成,保持高流畅、高动态的画面效果。

在画面质感上,Vidu在构图、叙事和光影等方面,能达到接近电影级效果。此外,Vidu还能生成影视级特效画面,如烟雾、炫光效果、CG特效等。

官方访问地址:https://www.vidu.studio/

声明:聚好用AI所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得聚好用AI同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
AI绘图创作发现

猿辅导出品的AI生成UI工具Motiff,挑战Figma

2024-8-2 18:44:21

AI视频创作发现

全网首发:智谱「Sora」此刻开源,单卡可跑可调,附训练细节

2024-8-6 10:40:13

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧