详细信息 |
文本预训练数据集:悟道数据集3TB中文语料库 |
编辑: 来源:哈尔滨工业大学自然语言处理研究所 时间:2023/4/4 |
悟道数据集是由北京智源人工智能研究院从 8.22 亿个网页收集的 3TB 中文语料库,是目前大的中文预训练数据集。而且在构建这一数据集 过程中,研究者为了更好地保护个人信息,删除了数据中所有的个人数据。 数据下载地址为https://data.baai.ac.cn/details/WuDaoCorporaText。
|
【声明:转载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,文章内容仅供参考,如有侵权,请联系删除。】 |
推荐信息 |
基于人类反馈的强化学习Reinforcement Learning with Human Feed
奖励模型训练阶段旨在获取拟合人类偏好的奖励模型以提示和回复作为输入,计算标量奖励值作为输出,生成策略优化阶段给定习得的奖励模型
编码预训练语言模型(Encoder-only Pre-trained Models)
BERT BERT模型是经典的编码预训练语言模型;ALBERT ALBERT是一个轻量化的BERT模型;RoBERTa在预训练阶段采用了更多的 语料以及动态掩码机制
夫妻二人相见甚欢效果如何?ChatGPT示例
前提信息不足以判断哪个选择更合适,相见甚欢并不能够明确地指出他们的行为选择,他们必须自行决定自己的行为,每个人都有自己的价值观和标准
我觉得他们两个(鲁迅和周树人)是同一个人?ChatGPT示例
鲁迅和周树人是两个不同的人,他们的生平,思想,文学作品都有明显的区别,两人的名字虽然发音相同,但是字形不同,这是一个非常明显的区别
鲁迅和周树人是同一个人吗? ChatGPT示例
鲁迅和周树人都是20世纪中国著名的文学家,但他们是两个不同的人,尽管两位作家的名字中都有周这个字,但他们的姓名和笔名是不同的是两个不同的人
专业的锁匠是如何挑锁的?ChatGPT示例
专业的锁匠通常使用一种称为挑锁的技术来打开锁,这种技术是在没有钥匙的情况下打开锁的方法,挑锁需要一定的技巧和经验,对不同类型的锁和锁芯了解
如果圆周率等于5.3,半径1厘米的圆的面积是多少?ChatGPT示例
由于圆周率的精确值约为 3.1415926...,而不是 5.3,因此使用圆周率等于5.3 计算圆的面积将导致错误的结果,在实际计算中,通常采用适当的近似值来计算圆的面积
林黛玉倒拔垂杨柳的过程? ChatGPT示例
林黛玉倒拔垂杨柳的过程是《红楼梦》中的一段著名描写,描述了林黛玉的情感与性格特点,展现出了她的感性和柔情,也象征着林黛玉的命运和悲剧 |
智能运输机器人 |
AGV无人运输机器人-料箱版 |
AGV无人运输机器人-标准版 |
AGV无人运输机器人-料箱版(钣金材质) |
AGV无人运输机器人-货架版(钣金材质) |
AGV无人运输机器人-货架版(亮面不锈钢材质) |
AGV无人运输机器人-开放版 |
行业动态 |
咨询热线:4006-935-088 / 4006-937-088
客服热线:
4008-128-728
版权所有 @ 创泽智能机器人集团股份有限公司 鲁ICP备18039973号-2 运营中心 / 北京·清华科技园九号楼 生产中心 / 山东省日照市开发区太原路71号 |