详细信息
 

ChatGPT革命性的突破之处:通用人工智能

编辑:      来源:国海证券      时间:2023/5/12
 

从前沿的研究和应用方向来看,AI(人工智能)主要有 NLP(自然语言处理)、CV (计算机视觉)两大L域,分别聚焦于对自然语言和图像进行分析、处理。其中, ChatGPT 及其背后的 GPT 系列模型带来的影响主要集中于 NLP L域。因此,我们通过 复盘过去 10 年 NLP L域的技术发展,来解答一个关键的问题:从技术角度看,ChatGPT 究竟是不是革命性的突破?

从技术角度复盘过去 10 年的 AI 发展历程,有四个重要的时间节点:

1)2017 年 Transformer 统一 NLP 研究范式。谷歌在著名论文《Attention Is All You Need》中推出 Transformer 架构,通过引入“自注意力”机制,J大拓展了 AI 模型在不同任务中的可迁移性。该论文发布 5 年内被引用超过 3.8 万次,统一了 NLP 的研究范式,后续也被广泛跨L域应用于 CV 场景。

2)2018 年谷歌、OpenAI 路线之争:完形填空 vs 文本生成。2018 年,谷歌、 OpenAI 基于 Transformer 框架,分别推出了 AI 模型 BERT 和 GPT-1。通俗来讲,二者 技术路线主要的区别在于:预训练任务中,谷歌 BERT 主要使用“完形填空”的方 式,即随机遮盖一些文字,让 AI 模型通过上下文理解进行补全;而 GPT 则主要使用 “文本生成”的方式,即通过完全遮盖训练语料中的“下文”,训练模型基于“上文”, 逐字逐句地生成文本。从应用结果来看,谷歌 BERT 在文本分类、关键词提取等“自 然语言理解”类任务中的表现好于初代 GPT。而后续随着模型参数量的指数J提升, GPT 模型在翻译、写作、问答等“自然语言生成”类任务中的优势开始逐步显现。

3)2020 年 GPT3 优势初显,千亿参数量催生“涌现”效应。2020 年,OpenAI 推 出新的 AI 大模型 GPT-3,其参数量G达 1750 亿,相较上一代 GPT-2 的 15 亿G出一 百余倍。2020 年后,AI 大模型的“涌现”效应得到业内的广泛关注,即当参数量G 于特定量J后(一般认为千亿J别是门槛),再基于模型结构、训练方法的调整,AI 大模型的特定性能会出现指数J的提升,如能够准确回答未经过训练的问题。此后, 谷歌、Meta 等相继推出千亿参数大模型,而 GPT-3 的技术路径优势日益凸显。

4)2022-2023 年:ChatGPT 横空出世,技术路径再统一。2022 年 11 月,OpenAI 基于新 AI 大模型 GPT-3.5,使用来自人类反馈的强化学习(RLHF)进行精调,发布 了聊天机器人 ChatGPT。经过广大 B 端、C 端用户的大规模测试,ChatGPT 在文本生 成场景中的通用性远超过谷歌 BARD 等同类应用。2023 年 3 月,OpenAI 发布 GPT-4, 使得 ChatGPT 的问答深度、广度,以及多模态识别能力进一步增强。至此,OpenAI 的 GPT 系列已全面于谷歌、Meta 等竞争对手,其技术路径的先进性得到充分验证。


 
【声明:转载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,文章内容仅供参考,如有侵权,请联系删除。】
 
推荐信息
AI显性化的三个阶段:技术奇点 产品破圈 大模型生态
技术奇点支持图片内容的输入多模态识别能力显著增强;C端产品破圈允许第三方开发 ChatGPT Plugin 插件;国内大厂跟进大模型生态起步
文本生成:Transformer架构实现并行处理,提升模型训练效率
Transformer模型通过采用Self-Attention 自注意力机制,在垂直方向上传播,不断叠加Self-Attention层,每一层的计算都可以并行进行
以ChatGPT为代表的AIGC行业产业链逐步形成
上游主要包括数据供给方,算法/模型机构,创作者生态以及底层配合工具等;中游主要包括文字,图像,音频,视频等数字内容的处理加工方;下游主要是各类数字内容分发平台
GPT-4: 从“百科全书”逐步成为文理通吃的“专家”
GPT-4在机器学习模型学术基准数据集上的表现实现了全面突破,在7项数据集中的测试 均优于当前最优的语言模型,在其他语言方面的表现也优于现在的语言模型
GPT-4:从语言模型走向多模态模型,带来更为丰富的应用场景
GPT-4是大型多模态模型,能够接受图像和文本两种模态的输入,再通过文字给出正确的文本答复,在多个不同的应用场景中展现 出强大的能力
HireStack结合GPT提升面试效率 Pencil生成多样化广告
AI能够极大提升HireStack工作效率;生成面试问题以及对应的答案;Pencil可以生成富有创意且符合品牌要求的广告文案和视频
Brex,Slack,ChatSpot.ai辅助实现多类任务
Brex宣布推出基于OpenAI技术的先进人工智能工具;Slack是Salesforce旗下的团队协作工具;将ChatGPT等AIGC技术与CRM结合,辅助实现多类任务
AIGC商业化演进:重点产品时间线
ChatGPT发布的多模态预训练大模型GPT-4已开放纯文本API,在图片理解,推理和学术考试中展现了强大能力,未来将适用于更广泛的应用场景
智能运输机器人
AGV无人运输机器人-料箱版
AGV无人运输机器人-标准版
AGV无人运输机器人-料箱版(钣金材质)
AGV无人运输机器人-货架版(钣金材质)
AGV无人运输机器人-货架版(亮面不锈钢材质)
AGV无人运输机器人-开放版
行业动态
» AMR企业未来发展的建议:加强产学研合作 拓展应用领域与场景 突破关键技术
» 智能无人运输车AMR选型建议:安全性 稳定性 兼容性 成本和可维护性
» 物流企业自动化搬运项目:117台XPL搬运机器人用于快运件转运+物料暂存
» 工具制造业5G智慧工厂:10+台潜伏AGV+托盘式叉车用于线边仓转运
» 轮胎行业项目:2台室内平衡重式无人叉车LXP15-B用于半成品、成品自动化出入库
» 汽车零部件园区无人化物流项目:室外无人驾驶重载AGV用于车间到车间之间的物流运输
» 汽车行业智能搬运项目:30台XPL搬运机器人用于产线送料和成品转运
» 汽车新能源产线智慧物流项目-31台潜伏AGV应用环汽车总装车间转运
» 汽车行业多品类AGV整合项目:叉车AGV、潜伏牵引AGV、举升AGV、承载式双车联动AGV、功能型A
» 乘用车动力总成车间零部件集配项目-9台承载辊道式AMR,用于动力总成线边供给
 
首页    产品    方案    底盘    参数    关于
咨询热线:4006-935-088 / 4006-937-088     客服热线: 4008-128-728
版权所有 @ 创泽智能机器人集团股份有限公司    鲁ICP备18039973号-2    运营中心 / 北京·清华科技园九号楼    生产中心 / 山东省日照市开发区太原路71号