详细信息 位置: 首页 >> gpt人工智能  
 

MUGE数据集[清华大学和阿里巴巴]

编辑:创泽      来源:华泰证券      时间:2023/5/19
 

MUGE 数据集:于 2021 年由清华大学和阿里巴巴联合发布,包括图像描述、图像文本检 索和基于文本的图像生成 3 种多模态理解和生成任务。


 
【声明:转载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,文章内容仅供参考,如有侵权,请联系删除。】
 
推荐信息
MATINF数据集 是一个联合标注的大规模数据集,用于中文母婴护理领域的分类,问答和总结,数据集中的一个条目包括四个字段,问题,描述,类别和答案
ODSQA数据集由台湾大学发布。ODSQA 数据集是用于中文问答的口语数据 集。它包含来自 20 位不同演讲者的三千多个问题
豆瓣会话语料库包括一个训练数据集、一个开发集和一个基于检索的 聊天机器人的测试集,测试数据包含 1000 个对话上下文
E-KAR数据集包含来自公务员考试的 1,655 个(中文)和 1,251 个(英文)问题,这 些问题需要深入的背景知识才能解决
FCGEC数据集用于检测,识别和纠正 语法错误,是一个人工标注的多参考语料库,由 41340 个句子组成,主要来自公立学校语 文考试中的选择题
DRCD数据集中文机器阅读理解数据集,包含来自 2108 篇维基百科文章的 10014 个段落和由注释者生成的 33,941 个问答对
Ape210K是一个新 的大规模和模板丰富的数学单词问题数据集,包含 210K 个中国小学水平的数学问题,包含黄金答案和得出答案所需的方程式
Math23K是为解决数学问题而创建的数据集,数据包含从在线教育网站上抓取的 6 万多个中文数学单词问题,都是小学 生真正的数学应用题
 

gpt人工智能

 
 

迎宾机器人在楼梯处迎接客人
 
新动态