交流讨论

本版块未设置版块简介!请后台版块编辑添加。
  •  2帖子
  •  2讨论
  •  0关注

复旦大学团队发布Hallo多模态模型,首个音频驱动的人脸视频生成模型

发表于 2024-7-14 14:58:43 | 显示全部楼层 |阅读模式
227 0
<
本帖最后由 世界和平 于 2024-7-14 15:01 编辑


复旦大学与百度联合发布了一个名为"Hallo"的音频驱动的人脸视频生成模型,并在公开的学术论文"Hallo: Hierarchical Audio-Driven Visual Synthesis for Portrait Image Animation"中进行了详细介绍。作为首个基于扩散技术实现端到端高逼真人脸视频生成的开源项目,Hallo模型允许用户仅通过提供音频和选定的人像,即可轻松生成高度逼真的人脸视频。这一技术的推出标志着数字人视频生成领域的一项重大突破。Hallo模型已经发布在了始智AI wisemodel.cn开源社区。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
AI听听官网广告位招租VX:949261770 最新最大的AI语音说话唱歌模型下载网站www.aitingting.vip
全部评论

暂无评论,期待您打破宁静

您需要登录后才可以回帖 登录 | 立即注册
发表评论
发布 联系QQ