我国自研视频大模型面向全球上线
金钱精英
2024-11-19 23:09:55
0

输入文字描述或上传图片,就能生成一段逼真视频。近日,我国自主研发的通用视频大模型Vidu(www.vidu.studio)面向全球正式上线。据悉,这款视频大模型开放文生视频、图生视频两大核心功能,提供4秒和8秒两种时长选择,分辨率最高达1080P,生成一段4秒的视频片段经实测仅需30秒。

图为根据文字描述用Vidu生成的视频画面。(受访者供图)

Vidu由清华大学联合北京生数科技有限公司共同研发,于今年4月在2024中关村论坛年会上首次发布。清华大学人工智能研究院副院长、北京生数科技首席科学家朱军介绍,Vidu具有“长时长、高一致性、高动态性”的特点,可根据文字和图片生成高清视频,且能保持高流畅、高动态的画面效果。截至目前,Vidu可支持一次性生成最长32秒的视频。

“Vidu能模拟真实物理世界,生成细节复杂且符合物理规律的场景,例如合理的光影效果、细腻的人物表情等,还能创造出具有深度和复杂性的超现实主义内容。”朱军说,对于科幻、西部、浪漫、动画等多类型电影,Vidu能生成符合对应风格的画面片段,还能生成影视级特效画面,如烟雾、炫光等效果。

图为根据文字描述用Vidu生成的特效画面。(受访者供图)

据介绍,在动态性方面,Vidu可生成复杂动态镜头,支持大幅度、精准的动作生成,能在画面里实现远景、近景、中景、特写等不同镜头的切换,能直接生成长镜头、追焦、转场等效果。

记者从北京生数科技有限公司获悉,除文生视频和图生视频的两大基础功能外,为了给用户提供更多样化和个性化的视频创作体验,Vidu还上线“动漫风格”和“角色一致性”两大新功能。在“图生视频”板块中,利用“角色一致性”功能,用户可上传人像图或自定义的角色图,通过文字描述就可指定图中角色在任意场景中做任意动作。该功能简化了视频制作流程,也提升了创作自由度。

据悉,操作Vidu无需申请,用户直接使用邮箱注册即可上手体验。Vidu的技术突破源于研发团队在机器学习和多模态大模型方面的长期积累,其核心技术架构由团队在2022年就提出并持续开展自主研发。(记者魏梦佳)

【责任编辑:王頔】

相关内容

好上好(001298)8月...
证券之星消息,截至2024年8月27日收盘,好上好(001298)...
2024-11-22 00:01:47
我国自研视频大模型面向全球...
输入文字描述或上传图片,就能生成一段逼真视频。近日,我国自主研发的...
2024-11-19 23:09:55
太兴集团(06811HK)...
格隆汇8月7日丨太兴集团(06811.HK)公告,根据董事会目前可...
2024-10-12 23:08:15

热门资讯

蔚来股价跌88%,负债率达87... 蔚来汽车旗下乐道品牌销量不给力,李斌推出更便宜的萤火虫,首款车型在4月19日上正式发布了。去年双12...
央媒评秦朗巴黎丢寒假作业事件:... 2月16日下午,在全网拥有4000万粉丝的网红短视频博主“Thurman猫一杯”,发布了一段1分37...
新股解读 连连数字:打造数字... 经济学家Richard Baldwin在其著述《大合流》中所说,信息与通信技术革命,推动全球经济版图...
聚焦乡村振兴 看数字普惠金融如...   北京12月24日电 “乡村振兴归根结底是发展问题,必须抓实抓好产业兴旺这个重点。”在12月24日...
信音电子最新公告:富拉凯咨询拟... 信音电子公告,富拉凯咨询计划在公告披露之日起15个交易日后的三个月内(2024年8月14日至2024...
福州包机迎回首批重点企业返岗务...   福州2月16日电 (郑江洛)15日,随着两架飞机平稳降落在福州长乐国际机场,来自云南、贵州的36...
诸葛亮生三子一女,你知道几个?... 挂有著名军事家、政治家、发明家等等称号的诸葛亮,娶妻黄月英,留下三子一女(养子亲子以及传说中的子女加...
2025年5月5日白山市星泰批... 品种 最高价 最低价 ...
回家过年|青岛:投资者“图鉴” (原标题:回家过年|青岛:投资者“图鉴”)编者按:回家过年,大概是中国人最整齐的一项集体仪式了。它是...
【Kitco金市展望】黄金能否... 尽管黄金仍然具有巨大的看涨潜力,但由于投资者等待美国劳动力市场健康状况的迹象及其如何影响美联储下个月...