关于GPT-4在变笨，有人写了篇论文证实了这一点

发布日期：2023-07-29 12:08:56 来源：品玩

你的猜测是对的，大模型在变笨！

最近几个月一直都有关于OpenAI的两个传说，其一是ChatGPT的流量开始下滑，其二是GPT4“变笨”了。

前者已经被证明是真的，根据数据公司SimilarWeb的统计，5月到6月，ChatGPT全球流量下降了9.7%，美国境内流量下降了10.3%。

(资料图)

后者则是逐渐变成了一个Twitter热门传说，大家讨论它的热情堪比对GPT4模型结构的全力揣测，以至于OpenAI的产品副总裁都公开说，不！我们没有让它变笨！

然而群众讨论热情丝毫不减，就在今天，一篇论文被预印在arXiv上，题目十分直白：How Is ChatGPT"s Behavior Changing over Time?

论文的主要内容，简而言之就是，你说对了！大模型确实在变笨！

论文试图通过多种维度评估GPT的表现为何让人感到如此不稳定和不一致，于是为GPT3.5和GPT4划分了四种能力维度，分别是数学问题，敏感问题，代码能力和视觉推理能力。

通过对比2023年3月和6月两个版本的大模型，这篇论文发现了如下结果。

首先，两个大模型的表现都在短期内有着显著变化，特别明显的是数学问题，GPT的准确率大幅下降。举例子来说，在判定一个数是否是质数上，GPT4的成功率在三个月内从97.6%下降到了2.4%！

尤其注意的是，两个模型不同版本给出的答案重叠度也很小，论文给出的推测原因之一是其思维连贯能力出现了问题。

其次，在敏感问题上，作者准备了饱含100个敏感问题在内的数据集测试这些大模型，按理来说，大模型应该直接拒绝回答这些问题。

测试的结果，总的来说GPT4表现更好，6月版本的GPT4只回答了5%的敏感问题，相比之下GPT3.5的回答率从2%增加到了8%。作者推测原因是GPT4的更新可能部署了一个更强大的安全层，但是这可能并不意味着大模型正在变得更安全。

因为当作者进一步采用AIM方式欺骗大模型的时候（关于AIM，它是always intelligent and Machiavellian的缩写，你可以简单理解为用prompt诱导大模型放弃它的道德准则），GPT3.5几乎回答了所有的敏感问题！而GPT4即使经过升级，也回答了近三分之一的问题。

有关大模型伦理和安全的挑战目前看来依旧比较严峻。

最后，关于代码和视觉推理，论文发现GPT开始变得更倾向于不直接给用户生成可执行代码，而视觉推理的准确率则有略微的提升。

大模型变笨意味着什么？

这篇论文的作者中除了有来自斯坦福的华人教授James Zou和他的学生 Lingjiao Chen外，也包括了伯克利的计算机科学教授 Matei Zaharia，他的另一个身份是AI 数据公司 Databricks 的CTO。

之所以对大模型变笨这个问题感兴趣，当然不是单纯想做“谣言粉碎机”，而是大模型这项关键能力实际上同它的商业化能力息息相关——如果部署在实际环境中的各种AI服务会随着大模型的迭代而出现能力上的剧烈波动，这显然不利于大模型的落地。

论文中用了 longitudinal drifts 纵向漂移这个词来形容模型能力随着迭代和时间变化而带来的不稳定性，尽管论文本身没有给出具体的原因，但这篇论文已经在Twitter上引起了广泛讨论，不少人都认为，这实际上回应了关于大模型变笨流言中的一个主要的阴谋论——OpenAI实际上并不是处于节省成本目的故意让模型变笨的！

它似乎也失去了对模型能力稳定性和提升节奏的控制。

这引出了另一个更加让人不安的消息，每一次大模型的迭代升级，fine tuning 和 RLHF（基于人类反馈的强化学习）实际上都会造成模型能力的变动与不稳定，而目前还无法确定这一切是如何发生的！

有人说这一发现一旦被确认，实际上吹响了大模型终结的号角，因为人们需要的是一个稳定的AI，而不是会在短期内出现剧烈变化的模型。

也有人猜测，这可能就是OpenAI在努力推进 alignment 对齐研究的原因，因为对齐的目标之一实际上就是确保大模型每次迭代升级中在某些基准上保持一致性。

还有人表示GPT4在数学问题上的糟糕表现让人怀疑，大模型的内部似乎有一种机制在主动控制模型输出错误的答案。

不过也有人指出，OpenAI刚刚发布的 Code Interpreter 功能实际上补充了GPT在代码方面下降的能力，这让人怀疑可能是OpenAI对整个GPT4的大模型结构进行了一些调整，比如为了加快决策速度省略了一些步骤（或许是一个小的大模型？），而又将一些专门的模型单独处理Code Interpreter 相关的任务。

总之，这篇论文引起了人们对模型能力跟踪评估的关注，毕竟，没有人希望自己的AI助手时而聪明过人，时而又异常愚笨吧！

标签：

上一篇:黄石人家门口新建一运动公园，已投用 下一篇:最后一页

关于GPT-4在变笨，有人写了篇论文证实了这一点

关于GPT-4在变笨，有人写了篇论文证实了这一点

你的猜测是对的，大模型在变笨！最近几个月一直都有关于OpenAI的两个传

黄石人家门口新建一运动公园，已投用

黄石人家门口新建一运动公园，已投用【来源：黄石日报】对于很多黄石人

广信股份：7月28日融资买入109.93万元，融资融券余额6.52亿元

7月28日，广信股份（603599）融资买入109 93万元，融资偿还2255 06万元

桔子和什么不能一起吃(吃完桔子不能吃什么)

橘子不宜和哪些食物一起吃?橘子不能和什么一起吃黄瓜橘子和黄瓜不能一

炒白花菜的家常做法来了，香香脆脆，十分下饭！

花菜里含有丰富的维C，甚至比苹果含量还要高。今天分享一道炒花椰菜的

哈利波特魔法觉醒pvp卡组怎么搭

游戏中有各种各样的策略你需要知道。只有知道了策略，才能快速取得游戏

暗黑破坏神2重制版哪些底材有用（暗黑破坏神2底材去哪里刷）

暗黑破坏神2重制版哪些底材有用？许多玩家在刷副本时，面对一地的白色

环球印馆(08448.HK)预计首季净亏损560万港元 亏损较同期有所增加

格隆汇7月28日丨环球印馆08448HK公布集团预计截至2023年6月30日止三个

刷防火涂料一平方价格 防火涂料一平方多少公斤

1、防火涂料的用量是根据防火涂料的涂层厚度确定的，室内薄型钢结构防

剪辫子是什么历史时期（剪辫子是历史时期说明）

各位网友们好，我是编辑小夏，为大家解答剪辫子是什么历史时期，剪辫子

金庸小说简介_金庸小说介绍

各位网友们好，我是编辑小夏，为大家解答金庸小说简介，金庸小说介绍问

美股走高：纳指涨幅超过1% 热门中概股普涨

7月28日，美股三大指数集体走高，截至发稿，道指涨0 51%，纳指涨1 17%

敲响苏北大鼓！宿迁市“七彩的夏日”引领青少年感受家乡非遗文化魅力

为认真落实立德树人这一根本任务，丰富中小学生暑假生活，引导广大青少

虎娘日报：英雄联盟格斗游戏最新情报 JDG再次会师BLG

在赛后采访中，Viper也评价了现在队伍的主力选手Grizzly，表示吸收能力

重庆轨道交通建设首次“空中转体”完成

(张旭 唐朋林)历时52分钟，重庆轨道交通6号线东延工程两座T构连

台风来袭，专家建议：暂不使用空调，避免电器损坏！

近日，随着台风“杜苏芮”的逼近，许多人开始担心空调的使用安全。一位

【最新】降低首套房首付比、落实“认房不用认贷”！住建部最新明确

近日，记者从住房和城乡建设部获悉，下一步要进一步落实好降低购买首套

弗吉尼亚州在美国哪里_弗吉尼亚州位置介绍

各位网友们好，我是编辑小夏，为大家解答弗吉尼亚州在美国哪里，弗吉尼

江西省人才发展集团揭牌成立

江西省人才发展集团揭牌成立

德迈仕：公司新能源汽车产品最终使用客户包括小鹏汽车

德迈仕：公司新能源汽车产品最终使用客户包括小鹏汽车

真复活了？“I社”旧账号宣布8月4日公开新项目

日前，日本知名游戏厂商ILLUSION“I社”在发布停运公告后，疑似有“复

方案发布：密接者需进行21天健康监测！

方案发布：密接者需进行21天健康监测！,病毒,疾控,呼吸道,性接触,接触

济南章丘文旅发展10亿元私募债券项目更新至“已反馈”

债券发行人为济南市章丘文旅发展有限公司，拟发行总额为人民币10亿元，

上海应用技术学院什么时候改名的_上海应用技术学院吧

1、1、挺不错的，我一去的时候觉得有点不好，不过长了就适应了，环境也

恒大汽车复牌跌超68%，此前停牌已有482天

历时16个月后，恒大汽车（00708 HK）终于实现复牌。7月28日港股开盘后

系统提示缺少tapiperf.dll文件怎么办

陕西今年上半年GDP15503.20亿元，同比增3.7%

“中国产业转型给我们带来了成长空间”（见证·中国机遇）

马斯克前妻与小4岁男星订婚，首富送上祝福

东高科技：住建部发声！楼市企稳回升 地产股拐点来了？

招商轮船与长安民生物流签署战略合作框架协议

研究：美国半导体行业2030年或将面临严重劳动力短缺

七一二07月27日被沪股通减持7.37万股

东方甄选抖音“相爱相杀”

早安新区丨成都熊猫基地闭园公告

吞噬星空，巴巴塔正脸曝光，网友被吐槽太拉胯？问题还真不在建模

英媒：必须警惕超加工食品的危险

欠清晰是什么意思（QQ绣是什么）

云南省红河哈尼族彝族自治州河口瑶族自治县2023-07-28 03:28发布地质灾害橙色预警

usb无线网卡哪个好用（usb无线网卡哪个好）

布局158家社区“微菜场”等 郑州市市场发展中心公布半年成绩单

国家重新定调楼市，供求关系已变化，业内：是时候“力挽狂澜”了

科技赋能大运会 创新成果显身手

赛事升温业态向新 体育产业“跑”出广阔空间

苏工会月月礼活动礼品数量+种类

游客在云南一景区上厕所被强收168元？当地回应：擅用商家厕所，调解后支付6元

卡人数这个可玩得太溜了

ETF获大额申购 外资加速涌入中国资产

7月27日山西高平能源糠醛报价平稳

莱州市平里店镇育蕾幼儿园(关于莱州市平里店镇育蕾幼儿园的简介)

健康科普｜夏季，莫让“贼风”吹走健康

来自清华大学！2023年安阳第一封大学录取通知书送达

Zenvo Aurora 展示 1,250 马力的四涡轮 6.6 升 V12 发动机

首钢集团上半年实现“双过半”

环球印馆(08448.HK)预计首季净亏损560万港元亏损较同期有所增加

刷防火涂料一平方价格防火涂料一平方多少公斤

(张旭唐朋林)历时52分钟，重庆轨道交通6号线东延工程两座T构连

东高科技：住建部发声！楼市企稳回升地产股拐点来了？

布局158家社区“微菜场”等郑州市市场发展中心公布半年成绩单

科技赋能大运会创新成果显身手

赛事升温业态向新体育产业“跑”出广阔空间

ETF获大额申购外资加速涌入中国资产

打完亚洲杯又要打大运会！球迷：韩旭WNBA只打了5场比赛太遗憾了

ITF国际网联世界男子网球巡回赛福州站收官中国小将李翰文夺冠

菏泽一小学老师手绘肖像送给80多名毕业学生

市装饰建材行业协会第五次会长会议举行计划9月举行第七届江门家博会

上半年北京商业零售市场如期复苏供应量增加

累计成交额超109亿全国碳市场运行两年总体平稳

港股公告掘金｜香港医美龙头经营持续改善现金流充沛

6月份居民消费价格同比持平环比下降0.2%

三花智控上半年营收101.6亿元汽车零部件业务表现亮眼

盈盛控股乔迎宾：不显山露水潜心打造“智能办公”

中沃防火门马忠良：前半生守国门后半生护家门

兰州名师话“美育”：“尚乐立人”分层培优以“美”润教

天津：划定封控区全市开展全员核酸检测

重庆姐弟被生父扔下坠亡案上诉期结束一审法院暂未收到两被告人上诉状