详细信息

Zero数据集-大规模的中文跨模态基准

编辑：来源：华泰证券时间：2023/5/19

Zero 数据集：于 2022 年由北京航空航天大学、清华大学、奇虎 360 人工智能研究所联合发布。Zero 是一种大规模的中文跨模态基准测试，其中包含目前大的公共预训练数据集 ZERO-Corpus 和五个用于下游任务的人工注释微调数据集。ZERO-Corpus 包含 2.5 亿张图片和 7.5 亿篇文字描述，另外五个微调数据集中的两个也是目前跨模式下游任务中大的数据集。

【声明：转载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述，文章内容仅供参考，如有侵权，请联系删除。】

推荐信息

Noah-Wukong数据集-华为诺亚方舟实验室
诺亚悟空数据集是一个大规模的多模态中文数据集,包含100万对图文对,数据集中的图像根据大小和宽高比进行过滤

MUGE数据集[清华大学和阿里巴巴]
MUGE数据集,于 2021 年由清华大学和阿里巴巴联合发布,包括图像描述,图像文本检索和基于文本的图像生成 3 种多模态理解和生成任务

MATINF数据集-武汉大学和密歇根大学
MATINF数据集是一个联合标注的大规模数据集,用于中文母婴护理领域的分类,问答和总结,数据集中的一个条目包括四个字段,问题,描述,类别和答案

ODSQA 数据集-台湾大学
ODSQA数据集由台湾大学发布。ODSQA 数据集是用于中文问答的口语数据集。它包含来自 20 位不同演讲者的三千多个问题

Douban Conversation Corpus 数据集
豆瓣会话语料库包括一个训练数据集、一个开发集和一个基于检索的聊天机器人的测试集，测试数据包含 1000 个对话上下文

E-KAR数据集-复旦大学
E-KAR数据集包含来自公务员考试的 1,655 个（中文）和 1,251 个（英文）问题，这些问题需要深入的背景知识才能解决

FCGEC数据集-浙江大学
FCGEC数据集用于检测,识别和纠正语法错误,是一个人工标注的多参考语料库,由 41340 个句子组成,主要来自公立学校语文考试中的选择题

DRCD数据集-台达
DRCD数据集中文机器阅读理解数据集,包含来自 2108 篇维基百科文章的 10014 个段落和由注释者生成的 33,941 个问答对

智能运输机器人

AGV无人运输机器人-料箱版

AGV无人运输机器人-标准版

AGV无人运输机器人-料箱版（钣金材质）

AGV无人运输机器人-货架版（钣金材质）

AGV无人运输机器人-货架版（亮面不锈钢材质）

AGV无人运输机器人-开放版

行业动态

» AMR企业未来发展的建议:加强产学研合作拓展应用领域与场景突破关键技术

» 智能无人运输车AMR选型建议:安全性稳定性兼容性成本和可维护性

» 物流企业自动化搬运项目:117台XPL搬运机器人用于快运件转运+物料暂存

» 工具制造业5G智慧工厂:10+台潜伏AGV+托盘式叉车用于线边仓转运

» 轮胎行业项目:2台室内平衡重式无人叉车LXP15-B用于半成品、成品自动化出入库

» 汽车零部件园区无人化物流项目:室外无人驾驶重载AGV用于车间到车间之间的物流运输

» 汽车行业智能搬运项目:30台XPL搬运机器人用于产线送料和成品转运

» 汽车新能源产线智慧物流项目-31台潜伏AGV应用环汽车总装车间转运

» 汽车行业多品类AGV整合项目:叉车AGV、潜伏牵引AGV、举升AGV、承载式双车联动AGV、功能型A

» 乘用车动力总成车间零部件集配项目-9台承载辊道式AMR,用于动力总成线边供给