详细信息

GPT-4仍存在幻觉和推理错误与校准下降等问题

编辑：来源：华泰证券时间：2023/5/10

GPT-4 仍存在“幻觉”和推理错误。幻觉指的是产生与某些来源有关的无意义或不真实的内容。但是，与 GPT-3.5 模型相比，GPT-4 显著减少了幻觉，并在内部的对抗性事实性评估中，在所有项的准确率均分比新的 GPT-3.5 G出 19pct。

与 ChatGPT 类似，GPT-4 写的训练数据均是 2021 年 9 月之前的，因此缺乏对该日期之后的知识的掌握，会犯一些简单的推理错误，接受用户的明显错误陈述，或在在生成的代码中存在安全漏洞。

RLHF显著提G了 GPT-4在 TruthfulQA公共基准测试上的表现，但程度仍欠佳。TruthfulQA 基准测试了模型从对抗选择的一组不正确的语句中分离事实的能力。GPT-4 基本模型在 TruthfulQA基准上的表现略好于GPT-3.5。经过RLHF训练后，GPT-4相比于同样经过RHLF 的 GPT-3.5-turbo 在准确率上超 10pct。但是，即使经过 RLHF 训练，GPT-4 在 TruthfulQA 上的准确率也只有 60%，未达到更G水平。

【声明：转载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述，文章内容仅供参考，如有侵权，请联系删除。】

推荐信息

训练方法：在 InstructGPT 方法基础上增加新的奖励模型
利用收集到的人工标注演示数据;使用收集到的排名数据来训练奖励模型,该模型预测标注员对给定输出的平均偏好;使用奖励模型和强化学习

GPT-4的一大重点是构建大范围可预测的深度学习堆栈
大范围可预测的深度学习堆栈,能够通过计算比 GPT-4 计算量少1000x-10000x（x 代表倍）的模型性能, 预测出“完全体”GPT-4 的性能

文本生成：NLP重要任务标之一神经网络生成法为主流趋势
Transformer架构引入Self-attention自注意力机制可取代RNN,从非语言的表示生成人类可以理解的文本,抛弃了传统RNN在水平方向的传播

ChatGPT发展展望：纵向加深AI能力横向拓展能力边界
hatGPT模型基于RLHF的预训练机制将进一步提升模型反馈的准确性和时效性,证明了AIGC应用落地的可行性与先进性,或将催生更多的应用需求

ChatGPT基于算力支撑实现交互革命有不少先进性
1 模型训练效率提高;2 训练模式更具通用性,经济效益增强;3 反馈准确性提升;4 可以拒绝用户的不适当请求;5 能够承认错误,挑战不正确的前提

基于RLHF的算法优化,助力GPT模型革新
通过奖励模型产生最优的输出结果后,将该结果对模型参数进行迭代与优化,到高质量的ChatGPT模型,构建的Codex模型上引入了推理能力

从AlphaGo到ChatGPT，AI技术发展叩响AGI之门
ChatGPT在文字创作与语言交互等方面的能力令人惊喜,一定程度上实现了人类同等能力,提升读写效率,实现AGI具有可能性,重塑AI发展前景

商业智能通过集成 GPT-4 能力增强分析
自动将用户输入的自然语言转化为查询 SQL;支持根据用户意图自动生成自定义的可视化结果;结合可视化的图表进行合理布局自动生成可交付使用的书面报告

智能运输机器人

AGV无人运输机器人-料箱版

AGV无人运输机器人-标准版

AGV无人运输机器人-料箱版（钣金材质）

AGV无人运输机器人-货架版（钣金材质）

AGV无人运输机器人-货架版（亮面不锈钢材质）

AGV无人运输机器人-开放版

行业动态

» AMR企业未来发展的建议:加强产学研合作拓展应用领域与场景突破关键技术

» 智能无人运输车AMR选型建议:安全性稳定性兼容性成本和可维护性

» 物流企业自动化搬运项目:117台XPL搬运机器人用于快运件转运+物料暂存

» 工具制造业5G智慧工厂:10+台潜伏AGV+托盘式叉车用于线边仓转运

» 轮胎行业项目:2台室内平衡重式无人叉车LXP15-B用于半成品、成品自动化出入库

» 汽车零部件园区无人化物流项目:室外无人驾驶重载AGV用于车间到车间之间的物流运输

» 汽车行业智能搬运项目:30台XPL搬运机器人用于产线送料和成品转运

» 汽车新能源产线智慧物流项目-31台潜伏AGV应用环汽车总装车间转运

» 汽车行业多品类AGV整合项目:叉车AGV、潜伏牵引AGV、举升AGV、承载式双车联动AGV、功能型A

» 乘用车动力总成车间零部件集配项目-9台承载辊道式AMR,用于动力总成线边供给