详细信息 |
DRCD数据集-台达 |
编辑: 来源:华泰证券 时间:2023/5/19 |
DRCD 数据集:于 2018 年由台达研究中心和台达电子联合发布。一个开放L域的传统中文 机器阅读理解数据集,包含来自 2108 篇维基百科文章的 10014 个段落和由注释者生成的 33,941 个问答对。
|
【声明:转载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,文章内容仅供参考,如有侵权,请联系删除。】 |
推荐信息 |
Ape210K数据集-猿辅导 AI Lab
Ape210K是一个新 的大规模和模板丰富的数学单词问题数据集,包含 210K 个中国小学水平的数学问题,包含黄金答案和得出答案所需的方程式
Math23K数据集-解决数学问题数据集
Math23K是为解决数学问题而创建的数据集,数据包含从在线教育网站上抓取的 6 万多个中文数学单词问题,都是小学 生真正的数学应用题
CAIL2018数据集 中国法律数据
CAIL2018是第一个用于判决预测的大规模中国法律数据集,收录 了中国最高人民法院公布 260 万件刑事案件,由适用的法律条款指控和刑期组成
中国开源大语言模型数据集 WuDaoCorpora数据集
WuDaoCorpora数据集采用 20 多种规则从 100TB 原始网页数据中清洗得出最终数据集,注重隐私数据信息的去除,支持多领域预训练模型的训练
中国开源大语言模型数据集 DuReader数据集
DuReader是一个大规模的开放域中文机器阅读理解数据集,问题和文档基于百度搜索和百度知道,答案是手动生成的,由200K问题,420K答案和1M文档组成
中国多模态大模型数据集构建
阿里M6大模型参数规模达到 1000 亿,构建了最大的中文多模态预训练数据集 M6-Corpus;百度ERNIE-ViLG大模型参数规模达到 100 亿
中国三个大语言模型数据集构建
百度Plato-XL大模型预训练语料规模达千亿级 token,模型规模高达 110 亿参数;华为盘古大模型开源了盘古α和盘古α增强版两个版本
国内优质中文数据集的重要来源 垂直内容平台
知乎作为问答知识平台,拥有超过4300万创作者产生的超过3.5亿条优质中文问答内容;垂类内容平台的数据可以作为细分领域大模 型精确训练的基础 |
智能运输机器人 |
AGV无人运输机器人-料箱版 |
AGV无人运输机器人-标准版 |
AGV无人运输机器人-料箱版(钣金材质) |
AGV无人运输机器人-货架版(钣金材质) |
AGV无人运输机器人-货架版(亮面不锈钢材质) |
AGV无人运输机器人-开放版 |
行业动态 |
咨询热线:4006-935-088 / 4006-937-088
客服热线:
4008-128-728
版权所有 @ 创泽智能机器人集团股份有限公司 鲁ICP备18039973号-2 运营中心 / 北京·清华科技园九号楼 生产中心 / 山东省日照市开发区太原路71号 |