首页 > 周边看点 > 正文内容

单图可生成视频,阿里云“魔搭社区”上线灵动人像功能

时间:2023-11-01 00:57:04

感谢IT之家网友 西窗旧事 的线索投递!

IT之家 8 月 16 日消息,阿里云“魔搭社区”现已上线灵动人像功能 Live Portait,上传一张照片和一段文本或语音即可生成一段开口说话的数字人视频。

IT之家实测,用户进入应用界面后上传形象照片,可选择文本驱动(100 字以内)或音频驱动,提供 28 种声音选择,若唇齿生成不清晰,可选择开启“唇齿修复”功能。此外,用户还可设置眨眼频率,在 0-4 之间选择,0 代表不眨眼。

设置完成后,上传图片可以像视频一样进行播报,可应用于视频直播、聊天机器人、企业营销等场景。据介绍,Live Portait 相关技术已被 CVPR、ICCV 等国际 AI 顶会收录。

在本月初,魔搭社区上架两款开源模型 Qwen-7B 和 Qwen-7B-Chat,阿里云确认其为通义千问 70 亿参数通用模型和对话模型,两款模型均开源、免费、可商用。其中,Qwen-7B 是支持中、英等多种语言的基座模型,而 Qwen-7B-Chat 是基于基座模型的中英文对话模型。

公开资料显示,魔搭是阿里达摩院与中国计算机学会(CCF)开源发展委员会在 2022 年联合推出的国内首个 AI 模型开源社区,把 300 多个模型开放给中国的 AI 研究者与团队,涵盖了自然语言处理,视觉、语音、多模态等模型。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

版权声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益, 请作者持权属证明与本网联系,我们将及时更正、删除,谢谢您的支持与理解。
标签:周边看点

热门文章

点击排行

前沿网 广州云媒派信息技术有限公司 版权所有 粤ICP备2021127029号网站地图 网站地图2