详细信息 位置: 首页 >> gpt人工智能  
 

AI发展带动基础数据市场成长,高质量标注数据决定模型训练效果

编辑:创泽      来源:浙商证券      时间:2023/3/23
 

AI 模型发展带动训练数据需求升高,标注和结构化处理真正实现将数据转为为 AI 商 业价值。随着 AI 与各个产业结合得愈加紧密,AI 商业化程度进入新阶段,企业对 AI 在商 业化落地中的表现要求越来越高。为了保证 AI 算法的识别精度,数据标注的质量也就变得 至关重要。

AIGC 向图像、语音、文字多维数据延伸,AI 基础数据服务与治理赛道有望受益加速 成长。数据服务是利用数据采集与标注工具处理图片、语音、文本等非结构化数据,数据治理则使用数据治理的各模块管理多源异构数据,提高数据质量并形成数据资产。高质量 的数据可供各行业 AI 厂商训练模型,并支撑各场景商业化产品的落地。

数据标注目前仍以人工为主,行业向智能化和去人工化趋势演进,标注数据生产效率 与 AI 模型进步协同共振。不同于计算机视觉领域 AI 模型训练所用的图像数据,NLP 模型 训练的数据往往来自于半结构化或非结构化的信息,目前无法实现 AI 算法模型的自动化标 注,目前主流的实现路径是人工标注与智能标注协同方案,即人工完成一小部分的数据标 注,再借助算法模型对剩余数据进行标注,通过人工对部分难例数据样本的二次标注后, 最终形成高质量的标注数据。



 
【声明:转载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,文章内容仅供参考,如有侵权,请联系删除。】
 
推荐信息
Make-A-Video模型实现AI基于文本图像智能生成视频,在文本语义和图像对应关系的基础上,通过对视频帧 序列的学习训练,实现连贯运动且高分辨率的高质量视频生成
OpenAI 公司宣布推出付费试点订阅计划 ChatGPT Plus;定价每月 20 美元;付费版功能包括高峰时段免排队;快速响应以及优先获得新功能和改进等
StarX MusicX Lab音乐实 验室已经在Spotify SoundCloud QQ 音乐和网易云音乐等渠道发布了首批五首由AI作曲的作品,后续还有其他歌曲陆续发出
文心ERNIE 3.0 Zeus模型可生成诗歌 剧本 小说等 多类型文本创作;通过一段描述文本所生成的图片,更加关注文本和图像中核心语义元素 贴近用户需求
数字虚拟偶像希加加完成AI思维创作;情感陪伴型虚拟博主林开开和叶悠悠在线陪伴对话,支持文字 语音 表情包聊天互动
magen已 开放提供城市梦想家和Wobble两个功能;城市梦想家可以用文字命令创建样本建筑和地块;Wobble可以创造一个小怪物设计其材质让小怪物跳舞
Sparrow是基于谷歌自有的大型语言模型Chinchilla进行训练的聊天机器 人,通过学习众多的数据让模型的参数更加确定、模型更加成熟
Sparrow为用户的提问给出合理 有用 符合语境 合规的解答,并利用谷歌搜索出的相关信息作为支撑证据,已有一套规则模型,来训练其避免回答违反规则的问题。
 

gpt人工智能

 
 

迎宾机器人在楼梯处迎接客人
 
新动态