阿里推出数字人视频生成工具:单张图片生成逼真数字人

2023-08-20 00:00:16 | 来源:中关村在线


(资料图)

阿里云近日推出了一款名为Live Portait的数字人视频生成工具。用户只需上传一张照片和一段文本或语音,就能生成一段能开口说话的数字人视频。这项功能可应用于视频直播、聊天机器人、企业营销等场景,目前已在魔搭社区创空间开放体验。随着对话大模型和AI绘画模型的热度不减,业界对生成式AI的研究逐步朝更多模态的方向演进,其中AI视频生成技术备受关注。这项技术能将文本或音频等信息转换为面部运动信息,进而驱动生成照片人物形象的动画,有效降低了视频拍摄和制作的门槛。Live Portait工具由运动模块和生成模块组成,采用阿里云自研的口型预测算法,使得生成的口型准确度大幅提高。在训练阶段,工具增加了姿态的显式控制,无需底板视频也可以生成任意动作的视频,大幅提升了数字人说话的真实感。此外,通过眼神主动控制技术,Live Portait可以为眼球增加一些自然运动,使得生成结果在观感上更接近真人效果。据了解,Live Portait相关技术已被CVPR、ICCV等国际AI顶会收录。在魔搭社区上,用户在上传照片后,可选择文本驱动和音频驱动两种方式,文本驱动模式下,该工具提供了普通话、英语、粤语、童声等28种声音。此外,Live Portait还提供了轻量模型选择,帮助用户更快速生成视频。阿里云的工具算法负责人张邦表示:“Live Portait集成了团队多项自研创新技术,例如仅需单张图片就能生成逼真的面部动画,突破了传统对抗生成网络的局限。随着技术的进一步迭代,图生视频有巨大的应用空间,有望成为企业降本增效的生产工具。”据悉,该团队研究方向涵盖数字人、3D模型AI生成、高真实感渲染、自然人机交互等领域,目前已发表50多篇国际顶会论文。

上一篇 下一篇

相关新闻

阿里推出数字人视频生成工具:单张图片生成逼真数字人

优德精密:8月18日召开董事会会议

3000亿资金借道ETF布局,宽基成近期“吸金”主力

中建·京西印玥 |西五环难得5-6层低密洋房,实景现房兑现墅境想象

每日信息速递

金陵怀古唐刘禹锡古诗诵读 金陵怀古

受害人竟成诈骗团伙帮凶

打不起来了?扎克伯格指责马斯克“耍花招”

最高检:将开展食药安全领域“网络直播营销”专项监督活动

派能科技:董事长提议回购不低于8000万元且不超过1.2亿元公司股份

厚普股份:公司合作的客户主要为中石油、中石化、中海油、各大燃气集团、各地交运集团、物流、港口码头等

今日申购:泰凌微

四川严查粮食购销领域问题虚假整改 铁纪守护天府粮仓

华尔街大行纷纷警告!这种“投机期权”将带崩美股?

河南省漯河市2023-08-17 07:24发布高温橙色预警

最新新闻

阿里推出数字人视频生成工具:单张图片生成逼真数字人

湖南省2023年普通高校招生高职专科批(普通类)第一次征集志愿投档分数线出炉

8月沪牌拍卖结果公布:中标率13.8% 平均成交价92753元

全国太阳能发电装机容量同比增长42.9%

地方债发行提速 28省三季度挂出2.5万亿发行规模

7117家门店、年营收42亿,茶百道要上市了

极端天气频发冲击欧洲经济复苏

国家安全部:网络攻击背后发现境外情报机构特征,怎么办?

中国超高海拔地区装机容量最大抽水蓄能电站开工建设

中方再回应赖清德“过境”窜美:任何阻挡中国统一进程的图谋都注定失败

70分钟内连震3次!四川内江发生3次3级以上地震,最大4级

城投控股:公司保持稳健经营,营业收入的变化主要受房地产行业周期性以及产品结构的影响

葡萄现代栽培关键技术(关于葡萄现代栽培关键技术简述)

konka电视怎么开启_konka电视怎么开

ESPN:切尔西加入签约弗雷斯内达竞争,球员在等待巴萨决定

夏于乔电视剧(夏雨乔)

新鸿基公司(00086)8月18日斥资约5.57万港元回购2万股

赵露思成为人鱼公主!紫色抹胸鱼尾裙引发热议!

西共体就尼日尔局势召开军事会议

chinapost.com.cn邮箱登录(www chinapost com cn)

最高气温34℃,闷热持续!今天北京局地雷阵雨,本周日降雨明显

电脑摄像头怎么拍照 电脑摄像头拍照方法 怎么使用电脑摄像头拍照

绿色转型成功经验!全国最大露天矿排土场光伏项目并网发电

“银川好医生”哈文静:近30载从医路 守护万千光明

8月17日基金净值:招商双债增强债券(LOF)C最新净值1.499

优德精密:8月18日召开董事会会议

16处公厕升级!内外全面提升

3000亿资金借道ETF布局,宽基成近期“吸金”主力

《原神》深潮的余响秘境位置介绍

奋斗吧少年(奋斗qvod)