久久精品国产精品青草色艺_www.一区_国内精品免费久久久久妲己_免费的性爱视频

GPT-4寫代碼能力提升21%!MIT新方法讓LLM學會反思,網(wǎng)友|和人類的思考方式一樣[搜索策略]?

聲明:本文來自于微信公眾號 量子位 (ID:QbitAI),Pine 發(fā)自 凹非寺,授權(quán)轉(zhuǎn)載發(fā)布。

GPT-4再度進化!

加上一個簡單方法,就能讓GPT-4這類大語言模型學會自我反思,性能直接提升30%。

在此之前,大語言模型回答出錯,經(jīng)常是二話不說,直接先道歉,然后emmmmmm,繼續(xù)亂猜。

現(xiàn)在,它不會這樣了,有了新方法的加成,GPT-4不僅會反思自己哪里錯了,還會給出改進策略。

比如說它會自動分析為什么“陷入循環(huán)”:

或者說反思一下自己有缺陷的搜索策略:

這是美國東北大學聯(lián)合MIT發(fā)表的最新論文中的方法:Reflexion。

不僅適用于GPT-4,也適用于其他大語言模型,讓它們學會人類特有的反思能力。

目前該論文已經(jīng)發(fā)表在預印平臺arxiv上。

這把直接讓網(wǎng)友直呼“AI進化的速度已經(jīng)超過我們適應的能力了,我們要被毀滅了。”

甚至有網(wǎng)友為開發(fā)人員發(fā)來“飯碗警告”:

用這種方法寫代碼的時薪是要比普通開發(fā)人員便宜的。

利用二元獎勵機制實現(xiàn)反思

正如網(wǎng)友所言,Reflexion賦予GPT-4的反思能力和人類的思考過程差不多:

可以簡單用兩個字來概括:反饋。

在這個反饋過程中,又可以分為三大步:

1、評估:測試當前生成答案的準確性

2、自我反省的產(chǎn)生:錯誤識別——實現(xiàn)修正

3、執(zhí)行一個迭代反饋循環(huán)

在第一步評估的過程中,首先要經(jīng)歷的是LLM(大語言模型)的自我評估。

也就是說LLM在還沒有外部反饋時,首先要自己對答案進行反思。

那如何進行自我反思?

研究團隊使用了一個二元獎勵機制,為LLM在當前狀態(tài)下執(zhí)行的操作賦值:

1代表生成的結(jié)果OK,0則表示生成的結(jié)果不太行。

而之所以采用二元而非多值或連續(xù)輸出這類更具描述性的獎勵機制,原因和沒有外部輸入有關(guān)。

要在沒有外部反饋的條件下進行自我反思,必須將答案限制在二元狀態(tài)下,只有這樣,才能迫使LLM做出有意義的推斷。

在自我評估結(jié)束之后,如果二元獎勵機制輸出為1,則不啟動自我反思裝置,若為0,LLM則會開啟反思模式。

在反思的過程中,模型會觸發(fā)一個啟發(fā)性函數(shù)h(如下),類比人類思考過程,h起到的作用就像是監(jiān)督一樣。

不過,同人類思考一樣,LLM在反思的過程中同樣也有局限性,這在函數(shù)中的Ω和ε中就能體現(xiàn)。

Ω表示重復連續(xù)動作的次數(shù),一般會將這個數(shù)值設(shè)置為3,這表示反思過程中若重復一個步驟三次,會直接跳到下一個步驟。

而ε則表示在反思的過程中允許執(zhí)行的最大操作數(shù)量。

既然有監(jiān)督,那修正也必須執(zhí)行,修正過程的函數(shù)是這樣子的:

其中,自我反思模型是通過“特定領(lǐng)域的失敗軌跡和理想反射對”訓練而來的,并不允許訪問數(shù)據(jù)集中給定問題的特定領(lǐng)域的解決方案。

這樣一來,LLM在反思的過程中便能夠迸發(fā)出更多有“創(chuàng)新性”的東西。

反思之后性能提升近30%

既然GPT-4這類LLM都能夠進行自我反思了,那具體效果究竟如何?

研究團隊在ALFWorld和HotpotQA基準上對這種方法進行了評估。

在HotpotQA的100個問答對測試中,使用Reflexion這種方法的LLM顯示出了巨大的優(yōu)勢,再經(jīng)過多輪反思重復提問之后,LLM的性能提升了接近30%。

而沒有使用Reflexion,在重復問答之后,性能沒有任何變化。

在HotpotQA的134個問答對測試中,可以看出在Reflexion的加持下,LLM經(jīng)過多輪反思后,準確率一度達到97%。

在另外一篇博客中,團隊成員也曬出了他們這種方法在GPT-4上的效果,測試范圍是編寫代碼。

結(jié)果也顯而易見,用了Reflexion,GPT-4的編程能力直接提升了21%。

關(guān)于GPT-4已經(jīng)會“思考”了,你怎(huang)么(le)看(ma)?

論文地址:

https://arxiv.org/abs/2303.11366

參考鏈接:

[1]https://nanothoughts.substack.com/p/reflecting-on-reflexion

[2]https://www.reddit.com/r/MachineLearning/comments/1215dbl/r_reflexion_an_autonomous_agent_with_dynamic/

編輯 舉報 2024-09-02 12:18

0個評論

暫無評論...
驗證碼 換一張
相關(guān)內(nèi)容
久久精品国产精品青草色艺_www.一区_国内精品免费久久久久妲己_免费的性爱视频

      久久精品男人天堂av| 91精品国产色综合久久不卡蜜臀 | 国产精品久久久一本精品| 99久久精品情趣| 日韩精彩视频在线观看| 国产亚洲成aⅴ人片在线观看| 91网址在线看| 另类综合日韩欧美亚洲| 亚洲色图在线播放| 亚洲精品在线免费播放| 91麻豆免费观看| 精品一区二区三区蜜桃| 亚洲黄色小说网站| 国产欧美一区二区在线| 欧美视频精品在线观看| 国产成人精品一区二区三区四区| 亚洲综合一区二区精品导航| 久久久精品人体av艺术| 欧美三级在线播放| 播五月开心婷婷综合| 青青草精品视频| 亚洲女同一区二区| 2023国产一二三区日本精品2022| 色综合亚洲欧洲| 国产精品中文字幕一区二区三区| 亚洲成人av中文| 18欧美亚洲精品| 国产免费成人在线视频| 欧美成人精品1314www| 精品视频1区2区| 色欧美88888久久久久久影院| 麻豆成人av在线| 亚洲国产色一区| 一区二区三区不卡视频在线观看| 国产欧美一区二区精品忘忧草| 欧美一区二区日韩一区二区| 色诱视频网站一区| 成人免费视频视频| 国产成人在线视频网站| 激情综合色综合久久| 日本不卡一二三| 性欧美疯狂xxxxbbbb| 一区二区三区四区在线| 一区二区三区中文字幕在线观看| 中文字幕在线不卡一区二区三区| 国产欧美日韩久久| 国产区在线观看成人精品| 久久久精品蜜桃| 久久久久久久av麻豆果冻| 日韩免费电影网站| 日韩免费成人网| 日韩丝袜情趣美女图片| 欧美成人一区二区三区在线观看 | 精品一区二区免费在线观看| 日本欧美大码aⅴ在线播放| 偷拍与自拍一区| 日本在线不卡视频一二三区| 青娱乐精品视频在线| 免费在线观看成人| 精品一二线国产| 国产精品一二三四五| 高清成人免费视频| 97精品超碰一区二区三区| 一本色道综合亚洲| 欧美日韩在线三区| 欧美一区二区三区影视| 精品国产乱码久久久久久免费| 久久中文字幕电影| 国产精品乱码人人做人人爱| 亚洲欧美偷拍三级| 亚洲电影在线播放| 看电影不卡的网站| 成人免费av在线| 91老司机福利 在线| 欧美日韩一区三区| 欧美哺乳videos| 中文字幕欧美日本乱码一线二线| 国产精品久久久久久福利一牛影视| 亚洲人成在线观看一区二区| 亚洲高清久久久| 日韩av一区二区三区四区| 国产一区二区在线观看视频| 大美女一区二区三区| 色综合中文综合网| 亚洲成av人片在www色猫咪| 亚洲成人av免费| 精品一区二区三区在线观看国产 | 亚洲大片免费看| 美女高潮久久久| 99久久国产综合精品麻豆| 欧美日韩国产综合视频在线观看 | 欧美专区日韩专区| 久久综合成人精品亚洲另类欧美 | 一区二区三区在线免费观看| 男男gaygay亚洲| caoporen国产精品视频| 欧美精品乱人伦久久久久久| 国产日韩欧美不卡| 视频在线在亚洲| 99久久国产免费看| 日韩免费视频线观看| 亚洲乱码日产精品bd| 国内精品久久久久影院薰衣草| 一本大道av伊人久久综合| 欧美变态口味重另类| 亚洲精品国产无套在线观| 国产一区二区三区久久久| 91麻豆自制传媒国产之光| 欧美成人女星排名| 亚洲电影在线免费观看| 91在线观看成人| 国产日韩欧美a| 蜜桃av一区二区| 欧美色综合天天久久综合精品| 欧美激情一区在线观看| 免费欧美在线视频| 欧美视频你懂的| 亚洲精品自拍动漫在线| 丁香亚洲综合激情啪啪综合| 欧美一区二区三区免费在线看| 亚洲精品自拍动漫在线| 国产99精品视频| 337p粉嫩大胆噜噜噜噜噜91av| 亚洲成av人影院| 在线精品视频一区二区三四| 国产精品不卡视频| 国产99精品在线观看| 国产亚洲综合在线| 韩国成人福利片在线播放| 91精品免费观看| 亚洲成av人片在线观看无码| 在线看一区二区| 亚洲精品ww久久久久久p站| 成人免费的视频| 国产农村妇女精品| 国产盗摄精品一区二区三区在线| 欧美精品一区二区三区视频| 青青草伊人久久| 欧美一二三四区在线| 三级久久三级久久久| 91精品国产综合久久久久| 午夜精品aaa| 91精品国产色综合久久| 秋霞午夜av一区二区三区| 欧美一区二区啪啪| 日韩—二三区免费观看av| 9191精品国产综合久久久久久| 亚洲高清免费视频| 91精品欧美久久久久久动漫 | 成人爽a毛片一区二区免费| 国产欧美日韩在线| a亚洲天堂av| 一区二区理论电影在线观看| 在线精品亚洲一区二区不卡| 亚洲综合久久av| 欧美乱妇20p| 久久精品国产久精国产| 久久久精品国产99久久精品芒果| 国产电影一区在线| 日韩伦理av电影| 欧美日韩你懂得| 激情图片小说一区| 中文字幕第一区第二区| 91免费国产在线观看| 偷拍一区二区三区| 精品播放一区二区| 99视频一区二区| 婷婷久久综合九色综合绿巨人| 日韩一区二区免费高清| 国产成a人无v码亚洲福利| 一区二区三区在线免费播放 | ww久久中文字幕| 成人高清在线视频| 亚洲超碰精品一区二区| 精品国产自在久精品国产| k8久久久一区二区三区| 亚洲成人动漫av| www国产亚洲精品久久麻豆| 99久久久国产精品| 日本特黄久久久高潮| 国产精品三级av| 91精品国产综合久久蜜臀 | 日本韩国精品在线| 麻豆国产欧美一区二区三区| 国产欧美精品国产国产专区| 欧美亚洲动漫精品| 国产精品综合网| 亚洲成人1区2区| 欧美极品xxx| 51午夜精品国产| 不卡视频在线看| 麻豆精品一二三| 亚洲黄色录像片| 国产午夜精品美女毛片视频| 欧美色图激情小说| 成人激情黄色小说| 国内久久精品视频| 天堂成人国产精品一区| 《视频一区视频二区| 26uuu国产日韩综合|