详细信息 位置: 首页 >> gpt人工智能  
 

AI Challenger图像中文描述数据集

编辑:创泽      来源:华泰证券      时间:2023/5/19
 

AI Challenger 图像中文描述数据集:数据来自 2017 AI Challenger,数据集对给定的每一 张图片有五句话的中文描述。数据集包含 30 万张图片,150 万句中文描述。数据集包含人 类关键点检测(HKD)、大规模属性数据集(LAD)和图像中文字幕(ICC)三个子数据集。

 
【声明:转载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,文章内容仅供参考,如有侵权,请联系删除。】
 
推荐信息
Product1M数据集是用于实际实例级检索的最大的多模式化妆品数据集之一,包含超过 100 万个图像对并且由两种样品类型组成
Flickr8k-cn 是公共数据集,每个测试图像与 5 个中文句子相关联,这些句子是通过手动翻 译 Flickr8k 中对应的 5 个英文句子获得的
COCO-CN数据集拥有20342张图片,27218 个中文句子和 70993 个标签,为跨语言图像标注,字幕和检索提供了一个统一平台
Zero是一种大规模的中文跨模态基准测试,其中包含目前最大的公共预训练数据集ZERO-Corpus和五个用于下游任务的人工注释微调数据集
诺亚悟空数据集是一个大规模的多模态中文数据集,包含100万对图文对,数据集中的图像根据大小和宽高比进行过滤
MUGE数据集,于 2021 年由清华大学和阿里巴巴联合发布,包括图像描述,图像文本检 索和基于文本的图像生成 3 种多模态理解和生成任务
MATINF数据集 是一个联合标注的大规模数据集,用于中文母婴护理领域的分类,问答和总结,数据集中的一个条目包括四个字段,问题,描述,类别和答案
ODSQA数据集由台湾大学发布。ODSQA 数据集是用于中文问答的口语数据 集。它包含来自 20 位不同演讲者的三千多个问题
 

gpt人工智能

 
 

迎宾机器人在楼梯处迎接客人
 
新动态