详细信息 位置: 首页 >> gpt人工智能  
 

AIGC 有望引领第四次人工智能浪潮

编辑:创泽      来源:浙商证券      时间:2023/3/23
 

AIGC 在图片、音视频领域的模型在大模型基础上持续优化,性能趋向商用化需求, 空间有望打开。我们认为以 ChatGPT 为代表,AI 将进入创造(创作)时代,引领第四次 人工智能浪潮。AIGC 以自动化生产和高效为两大特点,目前已经可以自动生成文字、图片、音频、视频,甚至 3D 模型和代码。未来大量数字原生内容有望由 AI 协助完成创作。

底层技术的突破使 AIGC 商业落地成为可能,模型迭代推动 AI 生成文字和图片质量 实现质的提升。

CLIP 模型打破了传统分类器界限,可以在不需要额外训练集的情况下,以良好的性 能完成各种计算机视觉任务。CLIP 模型对问题进行了重新定义并不再预测文本标签,取而 代之的是预测图像与文本相匹配的可能性大小,在大规模数据集上完成的训练后能够学习 到了图像的各方面信息。

Make-A-Video 模型实现 AI 基于文本、图像智能生成视频。在视频生成领域,Meta 公 司继承了图像生成模型的核心技术,在文本语义和图像对应关系的基础上,通过对视频帧 序列的学习训练,实现连贯运动且高分辨率的高质量视频生成。由于模型训练量要求过 大,目前该模型只能实现几秒钟的短视频生成,未来有望随着模型的迭代实现中视频和长 视频的生成。


 
【声明:转载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,文章内容仅供参考,如有侵权,请联系删除。】
 
推荐信息
OpenAI 公司宣布推出付费试点订阅计划 ChatGPT Plus;定价每月 20 美元;付费版功能包括高峰时段免排队;快速响应以及优先获得新功能和改进等
StarX MusicX Lab音乐实 验室已经在Spotify SoundCloud QQ 音乐和网易云音乐等渠道发布了首批五首由AI作曲的作品,后续还有其他歌曲陆续发出
文心ERNIE 3.0 Zeus模型可生成诗歌 剧本 小说等 多类型文本创作;通过一段描述文本所生成的图片,更加关注文本和图像中核心语义元素 贴近用户需求
数字虚拟偶像希加加完成AI思维创作;情感陪伴型虚拟博主林开开和叶悠悠在线陪伴对话,支持文字 语音 表情包聊天互动
magen已 开放提供城市梦想家和Wobble两个功能;城市梦想家可以用文字命令创建样本建筑和地块;Wobble可以创造一个小怪物设计其材质让小怪物跳舞
Sparrow是基于谷歌自有的大型语言模型Chinchilla进行训练的聊天机器 人,通过学习众多的数据让模型的参数更加确定、模型更加成熟
Sparrow为用户的提问给出合理 有用 符合语境 合规的解答,并利用谷歌搜索出的相关信息作为支撑证据,已有一套规则模型,来训练其避免回答违反规则的问题。
谷歌Sparrow、Apprentice Bard等作为类似ChatGPT的智 能聊天机器人模型,或将用于与搜索引擎结合,从而与ChatGPT抗衡
 

gpt人工智能

 
 

迎宾机器人在楼梯处迎接客人
 
新动态