数学论证GPT-4不是随机鹦鹉:真如此的话整个宇宙都会坍缩
2023-05-28 01:21:51 来源:量子位
克雷西 发自 凹非寺量子位 | 公众号 QbitAI
对于ChatGPT的工作原理,一个常见的解释是根据统计学规律预测下一个词。
(资料图片仅供参考)
但最近一位叫Jacob Bayless的工程师用数学方法得出惊人结论:
若是如此,所需的信息量足以让整个宇宙都坍塌成黑洞。
这一数据量是50000^8000,根据贝肯斯坦上限(Bekenstein bound)原理,如果把这些信息分配到空间当中,所需要的信息密度已经远超宇宙能承受的最大值。
而这仅仅是把数据存储起来的消耗,更不必说还要进行运算了。
而ChatGPT与单纯统计预测的区别,可以做这样的类比:
如果天文学家通过历史观测记录推算出月食的周期,这可以算是统计学。
但当他们总结出牛顿万有引力定律的时候,就已经超越了统计学。
什么是“随机鹦鹉”
一个流传很广的说法,所谓大语言模型实际上相当于一个“随机鹦鹉”——
与我们观察其输出时的情况相反,语言模型只是将其在庞大的训练数据中观察到的语素胡乱拼接在一起,根据概率生成文本,但不清楚文字背后的任何含义,就像一个随机的鹦鹉。出自论文On The Dangers of Stochastic Parrots: Can Language Models Be Too Big
这对过去的语言模型,或许确实成立。
比如曾经流行的n-gram算法。
比如当我们在搜索引擎中进行搜索时,出现的联想词就能用此方法实现。
具体来说,下面的三行文本中,第一行纯粹是随机生成,第二行考虑了单词在英语中整体的出现概率,第三行则考虑了单词在前一个词后面出现的概率。
n = 0: RECEIVE FALL SURPRISED FRIDAY INGREDIENT…n = 1: REPRESENTING AND SPEEDILY IS AN GOOD…n = 2: THE CHARACTER OF THIS POINT IS THEREFORE…
不难看出,随着n值的升高,文本越来越接近人类语言。
而n-gram模型根本不需要掌握其中的语义或理解其中的抽象概念,就能生成像模像样的句子。
据此有人猜想,GPT-4会不会也只是一种高级的n-gram呢?
Bayless提出,GPT必须学会抽象才能有如今的效果,至少GPT-4肯定如此。
GPT-4不只是“随机鹦鹉”
要证明这一点,可以先看下棋机器人的例子。
如果有一种下棋机器人,存储了巨量棋谱数据,对于每个棋局都能推荐下一步。
那它就能通过“背谱法”模仿其他任何棋手或程序的下法
比如Stockfish是最先进的国际象棋程序,如果仅通过对战而不看源码,是无法确定Stockfish是否在背谱。
但实际上,包含所有情形和步骤的棋谱数据量可能超过2^154。
而Stockfish的程序只占用了不到50MB的空间,根本不可能存下需要的所有棋谱。
所以Stockfish肯定是通过更高级的方法来实现下棋的。
人类语言的复杂度远超过棋类游戏,因此GPT的数据量更是同理。
仅在是上一代的GPT-3的token字典中就有超过5万token。
如果对每个词都逐一建立统计信息,n-gram模型中n值将高达8000。
届时,需要存储的情景数量将达到50000^8000。
正如文章开头所提到,这简直是天文数字,足以让整个宇宙坍缩。
因此,GPT是“随机鹦鹉”的猜测在理论上得到了一定程度的批驳。
“随机鹦鹉”达不到的高度
仅在理论上进行说明是不充分的,因此研究人员还进行了两个实验,意图证明大模型在学习过程中已经抽象出了算法。
第一个实验关于一道经典的农夫过河问题。
一个农夫有一条船,和狼、羊、菜,农夫要把这3样东西运到河到另一边,农夫每次最多只能通过这个船运一样东西,要防止狼吃羊、羊吃白菜(即不能在没有农夫在的情况下同时在同一岸边),该怎么过?
研究人员将这个问题中的农夫、船、河分别替换成地球人、虫洞和银河系。
狼、羊和菜则分别换成火星人、金星人和月球人。
替换的目的是因为互联网上不太可能出现类似语料,可以判断大语言模型是不是真的掌握了通用方法。
如果GPT不是“随机鹦鹉”,那么它至少不会犯下只有“随机鹦鹉”才会犯的错误。
GPT-4针对替换后的问题给出了正确的回答,GPT-3.5则没有。
但它们并没有犯研究人员预想的“鹦鹉”错误——即在回答中出现狼、船、河等已被替换掉的词语。
回答中使用的句子,也无法在互联网中被检索到。
这些现象都证明了现在的大语言模型的生成方式已经超越了“概率预测”。
第二个实验则是数字排序。
如果让GPT学习数字排序,它们究竟是只会记住给出过的数字顺序,还是真的研究出排序算法呢?
其实只要从GPT的输出当中就可以看出来了。
假如从1-100中随机选择10个数字,并将其顺序打乱,将一共有这么多种情形:
如果再考虑数字的重复出现,又或者数字的数量发生变化,根本不可能存储如此之多的情形。
因此,只要GPT能够针对未知的排序问题给出正确的回答,便可以说明它们是真的研究出了排序算法。
研究人员训练了一款特斯拉前AI总监Andrej Kaparthy发明的语言模型nanoGPT,专门让它做数字排序。
结果显示,随着训练步数的增加,模型给出的数字顺序越来越完美。
虽然在训练步数达到16万左右时突然出现了大量错误,但也很快得到了纠正。
这说明这款模型并不是仅仅根据学习的素材对未知的数字进行排序,而是已经掌握了背后的方法。
这个测试只是在一台笔记本电脑、算力非常有限的GPU上进行的。
更不必说GPT-4了。
参考链接:https://jbconsulting.substack.com/p/its-not-just-statistics-gpt-4-does
关键词:
为你推荐
-
数学论证GPT-4不是随机鹦鹉:真如此的话整个宇宙都会坍缩
-
指挥官的贴身保镖(碧蓝航线)
-
中评智库:统一前两岸政治关系探讨_世界滚动
-
12星座好运排行榜!(5月25日) 全球微速讯
-
女朋友问你喜欢她什么(女朋友问我喜欢她哪里)
-
环球观察:什么叫神经性头疼(什么叫神马)
-
超级忍者_关于超级忍者的介绍|世界速看料
-
当前通讯!那首歌李易峰歌词_李易峰所有歌的歌词 除小先生
-
泻湖与潟湖有区别吗(潟湖的特点) 今日要闻
-
原因披露?韩媒:韩亚航空事件男子称,提前开舱门是“想快点下飞机”
-
大众辉腾为什么那么贵_大众辉腾车标_全球即时
-
广州1-4月规上工业增加值同比下降4.2%,降幅比一季度收窄1.6个百分点 每日看点
-
【天天播资讯】又一国际评级机构将美国列入负面观察名单
-
张柏芝近照曝光!变化太大老态尽显,姐弟三人罕同框|环球快播
-
世界简讯:9岁男孩失踪13年后尸骨现身山林地缝,两名村妇被警方带走
-
刚宣布:近600亿规模基金公司股权变更|焦点热议
-
吉比特(603444)5月26日主力资金净买入1.13亿元
-
尝鲜今年第一口大闸蟹,“六月黄”在京开售
-
口碑排名:「南京湿疹正规医院」关注:南京皮肤专科医院有几家?
-
西安小吃集合_西安小吃大全|热文
推荐内容
- 数学论证GPT-4不是随机鹦鹉:真如此的话整个宇宙
- 指挥官的贴身保镖(碧蓝航线)
- 中评智库:统一前两岸政治关系探讨_世界滚动
- 12星座好运排行榜!(5月25日) 全球微速讯
- 女朋友问你喜欢她什么(女朋友问我喜欢她哪里)
- 环球观察:什么叫神经性头疼(什么叫神马)
- 超级忍者_关于超级忍者的介绍|世界速看料
- 当前通讯!那首歌李易峰歌词_李易峰所有歌的歌词
- 泻湖与潟湖有区别吗(潟湖的特点) 今日要闻
- 原因披露?韩媒:韩亚航空事件男子称,提前开舱门
- 大众辉腾为什么那么贵_大众辉腾车标_全球即时
- 广州1-4月规上工业增加值同比下降4.2%,降幅比一
- 【天天播资讯】又一国际评级机构将美国列入负面观
- 张柏芝近照曝光!变化太大老态尽显,姐弟三人罕同
- 世界简讯:9岁男孩失踪13年后尸骨现身山林地缝,两
- 刚宣布:近600亿规模基金公司股权变更|焦点热议
- 吉比特(603444)5月26日主力资金净买入1.13亿元
- 尝鲜今年第一口大闸蟹,“六月黄”在京开售
- 口碑排名:「南京湿疹正规医院」关注:南京皮肤专科
- 西安小吃集合_西安小吃大全|热文
- 头条:安阳钢铁:截至公告披露日 公司及控股子公
- 天天热资讯![预警]ST奥康(603001):股票交易被实
- 世界热消息:特斯拉车顶维权女车主败诉,两个诉讼
- 河南财经政法大学财政学怎么样就业|全球热闻
- 《明日之子3》李梦琦个人资料介绍_世界观天下
- 我只能永远读着对白歌词模板_我只能永远读着对白
- 美国4月核心PCE同比上涨4.7% 通胀上行超预期-今日热门
- 什克庆祝国米意杯夺冠:6年5冠,现在还差个欧冠冠
- 时讯:日本本州东岸近海附近发生6.2级左右地震
- 对冲基金抄底超短期美债获利,大型资管机构盯上美
- 环球快讯:做隐睾手术需要多久_做隐睾手术要多久恢
- 2024巴黎奥运会门票已售出680万张-通讯
- 愉悦的古诗有哪些 表达心情愉悦的古诗词-世界微
- 高级动卧一张票几个人(高级动卧)
- 天天资讯:怎么能够收缩毛孔_收缩毛孔的方法简述
- 睿能科技连收6个涨停板
- 桂东:“志愿红”助力旅发大会_天天最资讯
- 最后的驱魔人:恶灵的诅咒_对于最后的驱魔人:恶
- 天天动态:违约倒计时!美政府“家底儿”已不足500
- 哈六中领航示范发展共同体体育艺术教育暨全学科育
油气
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
经济
-
中新网杭州10月18日电 (王题题 胡燕婕)云天收夏色,浅秋正渐浓。10月18日,浙江杭州市西湖游船有限公司推出的惠民多站点“西湖环湖游
-
中国税务机关处罚一名艺人经纪人 中新社北京10月18日电 (记者 赵建华)上海市税务局第一稽查局前期在艺人郑爽偷逃税案件检查过程中
-
中新网兰州10月18日电 (闫姣 艾庆龙 吉翔)“红山白土头,黄河向西流。”不少人疑问,天下黄河向东流,为何甘肃永靖县这段黄河却向西
-
中新网北京10月18日电 《清华城市健康设施指数》18日在北京发布。报告成果显示,城市健康设施指数领先城市以中心城市和东部沿海城市
-
中新网安徽黄山10月18日电 (刘浩 黄启宝 汪娜)10月17日至18日,安徽省黄山市当地民警先后救助国家一级保护动物白锦长尾稚和野生梅花