详细信息
 

SadTalker开源项目,虚拟二三次元形象合成面部说这段语音的视频

编辑:      来源:算法邦      时间:2023/3/24
 

SadTalker是一篇 2023 年的 CVPR 论文对应的开源项目。

功能就是:根据一张图片、一段音频,合成面部说这段语音的视频。结合 ChatGPT、AIGC、音频文字转换,虚拟二次元 or 三次元形象,就能“活”过来了。

此外,还项目还做成了 stable diffusion webui 的插件,也就是直接能在 stable diffusion 里使用。

生成的图片,直接配合一段音频,就能生成合成的视频。

项目地址: https://github.com/winfredy/sadtalker

 
【声明:转载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,文章内容仅供参考,如有侵权,请联系删除。】
 
推荐信息
Visual ChatGPT微软开源的ChatGPT项目
Visual ChatGPT是微软开源的项目,是一个多模态的问答系统;支持AI绘画,语言问答,看图问答,将AI近期的3大热点集于一身,搭建一个多模态的问答系统
拓尔思-国内 NLP 龙头厂商,构建数字虚拟人的智能引擎
拓尔思基于中文 NLP 核心技术,海量数据积累及具备行业专业能力的知识图谱等元宇宙 技术基因的优势,提供虚拟人智能对话等技术支撑
场景模型持续简化以提升训练速度,控制成本满足商业化应用需求
Distilled BERT 模型直接将BERT的部分参数作 为初始化,模型参数只有 BERT 的约 40%,但速度快提升 60%,同时保留了 97%的语言理解能力
AI发展带动基础数据市场成长,高质量标注数据决定模型训练效果
数据标注目前仍以人工为主,行业向智能化和去人工化趋势演进,标注数据生产效率 与 AI 模型进步协同共振 最终形成高质量的标注数据
AIGC 有望引领第四次人工智能浪潮
Make-A-Video模型实现AI基于文本图像智能生成视频,在文本语义和图像对应关系的基础上,通过对视频帧 序列的学习训练,实现连贯运动且高分辨率的高质量视频生成
ChatGPT 面世即成顶流 性能持续提升商业化价值不断放大
OpenAI 公司宣布推出付费试点订阅计划 ChatGPT Plus;定价每月 20 美元;付费版功能包括高峰时段免排队;快速响应以及优先获得新功能和改进等
StarX MusicX Lab 聚焦AI作曲
StarX MusicX Lab音乐实 验室已经在Spotify SoundCloud QQ 音乐和网易云音乐等渠道发布了首批五首由AI作曲的作品,后续还有其他歌曲陆续发出
百度类ChatGPT产品 受益于文心Ernie系统积累
文心ERNIE 3.0 Zeus模型可生成诗歌 剧本 小说等 多类型文本创作;通过一段描述文本所生成的图片,更加关注文本和图像中核心语义元素 贴近用户需求
智能运输机器人
AGV无人运输机器人-料箱版
AGV无人运输机器人-标准版
AGV无人运输机器人-料箱版(钣金材质)
AGV无人运输机器人-货架版(钣金材质)
AGV无人运输机器人-货架版(亮面不锈钢材质)
AGV无人运输机器人-开放版
行业动态
» AMR企业未来发展的建议:加强产学研合作 拓展应用领域与场景 突破关键技术
» 智能无人运输车AMR选型建议:安全性 稳定性 兼容性 成本和可维护性
» 物流企业自动化搬运项目:117台XPL搬运机器人用于快运件转运+物料暂存
» 工具制造业5G智慧工厂:10+台潜伏AGV+托盘式叉车用于线边仓转运
» 轮胎行业项目:2台室内平衡重式无人叉车LXP15-B用于半成品、成品自动化出入库
» 汽车零部件园区无人化物流项目:室外无人驾驶重载AGV用于车间到车间之间的物流运输
» 汽车行业智能搬运项目:30台XPL搬运机器人用于产线送料和成品转运
» 汽车新能源产线智慧物流项目-31台潜伏AGV应用环汽车总装车间转运
» 汽车行业多品类AGV整合项目:叉车AGV、潜伏牵引AGV、举升AGV、承载式双车联动AGV、功能型A
» 乘用车动力总成车间零部件集配项目-9台承载辊道式AMR,用于动力总成线边供给
 
首页    产品    方案    底盘    参数    关于
咨询热线:4006-935-088 / 4006-937-088     客服热线: 4008-128-728
版权所有 @ 创泽智能机器人集团股份有限公司    鲁ICP备18039973号-2    运营中心 / 北京·清华科技园九号楼    生产中心 / 山东省日照市开发区太原路71号