GPT-4“自我反思”后能力大增,测试表现提升 30% 每日资讯

2023-04-04 12:12:34 来源:搜狐号-IT之家


(相关资料图)

IT之家 4 月 4 日消息,OpenAI 最新的语言模型 GPT-4 不仅能够像人类一样生成各种文本,还能够设计和执行测试来评估和改进自己的表现。这种“反思”技术让 GPT-4 在多项难度较高的测试中,都取得了显著的进步,测试表现提升 30%。

GPT-4 是继 GPT、GPT-2 和 GPT-3 之后,OpenAI 推出的最先进的系统,也是目前最大的多模态模型(可以接受图像和文本输入,输出文本)。其利用深度学习技术,使用人工神经网络来模仿人类的写作。

研究人员诺亚・辛恩(Noah Shinn)和阿什温・戈平纳特(Ashwin Gopinath)在论文中写道:“我们开发了一种新颖的技术,让 AI 代理能够模拟人类的自我反思,并评估自己的表现。GPT-4 在完成各种测试的时候,会增加一些额外的步骤,让它能够自己设计测试来检查自己的答案,找出错误和不足之处,然后根据发现来修改自己的解决方案。”

在 HumanEval 编码测试中,GPT-4 使用自我反思环路,准确率从 67% 上升到 88%

GPT-4 可以通过设计和执行测试来批判其自身的性能,如 AlfWorld 测试结果所示,可以大大改善其性能

研究团队使用这种技术对 GPT-4 进行了几种不同的性能测试。在 HumanEval 测试中,GPT-4 需要解决 164 个从未见过的 Python 编程问题,原本准确率为 67%,使用反思技术后,准确率提升到了 88%。在 Alfworld 测试中,AI 需要在各种不同的交互环境中,通过执行一些允许的操作,来做出决策和解决多步任务。使用反思技术后,GPT-4 的准确率从 73% 提高到了 97%,只有 4 个任务失败。在 HotPotQA 测试中,GPT-4 可以访问维基百科,并回答 100 个需要从多个支持文档中解析内容和推理的问题,原本准确率为 34%,使用反思技术后,准确率提高到了 54%。

这项研究表明,AI 问题的解决方案有时候是依赖 AI 本身。IT之家发现,这有点像生成对抗网络,这是一种让两个 AI 互相提高技能的方法,比如一个 AI 试图生成一些看起来像真实图片的图片,另一个 AI 试图分辨哪些是假的,哪些是真的。但在这种情况下,GPT 既是写作者又是编辑,通过自我反思来改进自己的输出质量。

标签:

知识领域 在家怎么养猪

如果你家是在山区的情况下。如果选择去养猪是一个很不错的选择。在山区养猪最基本的就是可以满足猪的活...

2023-01-21 09:50:37

探索百科 济州岛自由行攻略

最佳旅游时间:春秋季节是最适宜游览济州岛的。济州岛的气候根据季节的变化可以明显地划分为大陆性的海...

2023-01-21 09:50:34

百科大全 上海格力空调维修电话

上海格力空调售后服务中心:4008205460;上海客户24小时报修热线:02164021703。上海格力空调维修承诺:1...

2023-01-21 09:50:30

百科全书 为什么古代有太监的出现呢

太监这个用词最早是出现在辽,在明朝时,因为宫廷出现了十二监二十四衙门,最大的官是由太监担任,于是...

2023-01-21 09:50:24

知识智库 一次成功的实验成功的原因是什么

一次成功实验的原因如下:1、实验前的认真准备、设计实验中的认真操作。2、有科学严谨的态度。3、善于寻...

2023-01-21 09:50:19

百科词典 西点揭秘剧情详解

部队罪刑调查部的高级官员布伦纳和其小助手森希尔领命36钟头内调研清晰一块儿神密的凶杀案,副总统的强...

2023-01-21 09:50:16

智库知识 三十多岁男人发型

背头、纹理烫、板寸是合适30岁上下男士的头型,三十几岁提议是挑选成熟期的头型,简约干脆利落,空气刘...

2023-01-21 09:50:11

百科问答 女穿男小说多部

1、《大唐女驸马》,作者暗香花落;2、《落棋无声》,作者梦浮桥;3、《南宫旧事》,作者洋洋得色;4、《穿...

2023-01-21 09:50:07

知识课堂 有木有像山河日月一样的小说

1、《浮生劫》,作者是焦糖布丁;2、《消听残雪》,作者是馨瑀;3、《双花双叶又双枝》,作者是藤藤小猫;4...

2023-01-21 09:50:04

字词小课堂 武大郎什么时候被毒死的

武大郎被毒死的时间大概是农历四月二十八日-四月三十日。论据:《金瓶梅》第九回:西门庆偷娶潘金莲武都...

2023-01-21 09:49:58
x 广告
x 广告

Copyright ©  2015-2023 亚商网版权所有  备案号:京ICP备2021034106号-51   联系邮箱:5 516 538 @qq.com