详细信息 位置: 首页 >> gpt人工智能  
 

场景模型持续简化以提升训练速度,控制成本满足商业化应用需求

编辑:创泽      来源:浙商证券      时间:2023/3/23
 

大模型微调成本和维护成本过高。目前大模型厂商在用户需求较大时,微调成本和模 型维护成本会相当高,若仅提供推理服务,成本可以大幅降低但是模型精度会受到较大牺 牲,从而降低大模型的竞争力。并且 AI 项目实施通常会把模型部署到终端,对算力的要求 非常高,因此国内外大厂及研究院所均致力于对预训练模型进行“瘦身”。

模型蒸馏与迁移学习成为 AI 领域研究新方向,可大幅优化终端模型计算的时效性并 节约算力成本。“知识蒸馏”概念可类比于学校中的教学行为,可有效地压缩预训练模型的 大小。知识蒸馏包含已训练的 Teacher Model 和待训练的 Student Model,通过知识蒸馏和 迁移学习,学生网络可以拥有与教师网络相似和相近的计算性能。

知识蒸馏可以在基于高度复杂的大模型训练基础上,提升细分任务小模型的计算精 度,同时也可以有效降低模型延迟,并且压缩网络参数。基于知识蒸馏思想改进 BERT 预 训练模型,实现模型的简化和速度的提升。Distilled BERT 模型直接将 BERT 的部分参数作 为初始化,模型参数只有 BERT 的约 40%,但速度快提升 60%,同时保留了 97%的语言理 解能力。我们认为在人工智能通往商业化应用的道路上,早期专注于增加数据量、计算能 力或者训练过程的优化方式可能不再适用,未来各大厂商需要计算与预测性能之间做出权 衡,探索如何利用更少的数据与计算资源,帮助模型实现性能提升


 
【声明:转载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,文章内容仅供参考,如有侵权,请联系删除。】
 
推荐信息
数据标注目前仍以人工为主,行业向智能化和去人工化趋势演进,标注数据生产效率 与 AI 模型进步协同共振 最终形成高质量的标注数据
Make-A-Video模型实现AI基于文本图像智能生成视频,在文本语义和图像对应关系的基础上,通过对视频帧 序列的学习训练,实现连贯运动且高分辨率的高质量视频生成
OpenAI 公司宣布推出付费试点订阅计划 ChatGPT Plus;定价每月 20 美元;付费版功能包括高峰时段免排队;快速响应以及优先获得新功能和改进等
StarX MusicX Lab音乐实 验室已经在Spotify SoundCloud QQ 音乐和网易云音乐等渠道发布了首批五首由AI作曲的作品,后续还有其他歌曲陆续发出
文心ERNIE 3.0 Zeus模型可生成诗歌 剧本 小说等 多类型文本创作;通过一段描述文本所生成的图片,更加关注文本和图像中核心语义元素 贴近用户需求
数字虚拟偶像希加加完成AI思维创作;情感陪伴型虚拟博主林开开和叶悠悠在线陪伴对话,支持文字 语音 表情包聊天互动
magen已 开放提供城市梦想家和Wobble两个功能;城市梦想家可以用文字命令创建样本建筑和地块;Wobble可以创造一个小怪物设计其材质让小怪物跳舞
Sparrow是基于谷歌自有的大型语言模型Chinchilla进行训练的聊天机器 人,通过学习众多的数据让模型的参数更加确定、模型更加成熟
 

gpt人工智能

 
 

迎宾机器人在楼梯处迎接客人
 
新动态