每日經濟新聞 2023-06-03 11:06:31
◎OpenAI官方開發者推廣大使回應稱,GPT-4自從3月14日發布以來沒有發生改動。
每經記者 蔡鼎 每經編輯 譚玉涵
如今距離OpenAI于3月中旬推出其最新版本的大型語言模型GPT-4已經有近3個月的時間。這段時間內,盡管全球資本市場對人工智能、大模型和算力的炒作此起彼伏,也有人稱贊GPT-4這個版本強大的能力,但卻很少有人質疑GPT-4是否真的比此前更早期的版本強大。
近期,網上對GPT-4是否出現退化的質疑聲開始涌現出來,越來越多的網友開始表示,GPT-4對復雜程度相似的問題處理結果甚至還不如它的前身GPT-3或GPT-3.5。面對網友的大量質疑,OpenAI官方開發者推廣大使回應稱,GPT-4處于靜止狀態,且自3月 14日發布以來沒有做過改動。
根據OpenAI自己的說法,GPT-3擁有1750億個參數,但GPT-4的規??赡軙_到數千億個參數,甚至可能會突破萬億級別。這一規模的提升將有助于提高模型的表現力和泛化能力,使其更能適應各種語言任務,同時也意味著GPT-4接受了更多的數據訓練,模型文件中有更多的權重(參數),這也使得它的運行成本更高。
此外,GPT-4可以更準確地解決人們的難題,多模態的GPT-4還可以生成、編輯具有創意性或技術性的文章,在高級推理方面的表現超過其前身。當然,正如大家所猜測的那樣,微軟New Bing的聊天功能確實基于GPT-4。OpenAI稱,該模型“比以往任何時候都更具創造性和協作性”,“可以更準確地解決難題”。它可以解析文本和圖像輸入,盡管它只能通過文本進行響應。
官方表示,GPT-4錯誤答案更少,而且也會減少偏離話題的可能,也盡可能不會再談論禁忌話題,甚至在許多標準化測試中比人類表現得都要更好一些。
例如,GPT-4在模擬律師考試的成績在考生中排名前10%左右,在SAT閱讀考試中排名前7%左右,在SAT數學考試中排名前11%左右。相比之下,GPT-3.5在律師考試中的得分一般都是倒數10%左右。當然,它們考個研究生還是沒問題的。
圖片來源:OpenAI
不少業內人士也對GPT-4的未來應用前景表示看好,稱GPT-4的出現將進一步推動AI語言模型領域的發展。作為下一代AI語言模型,GPT-4將會在各方面都得到進一步的改善,包括語言理解、生成、多語種支持等等。同時,GPT-4也將會在各個應用場景中得到廣泛應用,為各個行業帶來更加高效和智能的解決方案。
那么,GTP-4真的如OpenAI自己所稱的那樣更強大嗎?
就在美東時間本周早些時候,Ycombinator上已有網友提出質疑,稱“(GPT-4)確實比以前快很多,但它的輸出質量更像是GPT-3.5++。GPT-4產生了更多的bug代碼,答案也缺乏深度和分析,總體感覺上比以前要糟糕很多。”
圖片來源:Ycombinator
在上述網友的帖子下方,另一名網友回復稱,“是的。在更新之前,GPT(的上一個版本)能毫不費力地解決相當復雜的編程問題,并對非編程問題給出非常微妙且像是經過深思熟慮的答案。如今,GPT-4只能修改一個10行CSS模塊中的兩行,并再次給出這修改后的10行模塊,不僅感到非常吃力,而且給出的答案中有些內容毫無關系……”
還有網友表示,“OpenAI的(最新)模型給我的感覺是100%被削弱了。幾個月前我用它(的早期版本)解決了非常復雜的問題(例如編寫一個最小的PDF解析器示例),但今天你會因為問了這么復雜的任務被GPT-4‘責備’。”這名網友最后還稱,他已經決定取消訂閱他的OpenAI會員資格。
圖片來源:Ycombinator
在推特上,有網友稱把GPT-4的3小時25條對話額度一口氣用完了,都沒能解決自己的代碼問題,最后無奈切換回了GPT-3.5。
圖片來源:推特
《每日經濟新聞》記者還注意到,網上關于GPT-4是否退化的討論,其實在1個月前就已經有了。當時有網友在美國版天涯+貼吧平臺Reddit上,對GPT-4是否“變笨”發出質疑。這名當時網友稱,“在過去幾天里,我經歷了GPT-4性能的明顯下降。它的推理能力已經退化到GPT-3的水平,而且它正在努力完成上個月剛剛為我完成的任務。今晚的性能還是最糟糕的。這是怎么回事?”
圖片來源:Reddit
在OpenAI的官方開發者論壇,有網友在4月30日就發帖稱,“一周前,我用GPT4為MS飛行模擬器創建了一個非常簡單的C#應用程序。這太神奇了,我只(手動)更正了一次。今天我用了同樣的提示詞,但經過多次修改后GPT-4還是不能正常使用。”
圖片來源:OpenAI
一時間,關于“GPT-4退化了”、“OpenAI為了節省成本開始偷工減料”等質疑聲開始在Ycombinator、Reddit和推特等平臺快速蔓延開來。速度如此之快,就連OpenAI官方的開發者推廣大使Logan Kilpatrick都出面來公開回應網友的質疑:“API不會在沒有我們通知您的情況下更改。”
圖片來源:推特
在上述推文下方,Logan還回復了網友一些問題,他稱,GPT-4自從3月14日發布以來未發生改動。他還表示,GPT-4對于一些提示詞給出的回答內容不一致,是由于大模型本身不穩定。不過,針對網頁版GPT-4是否被降級過的追問,均未得到其本人的正面回答。
圖片來源:推特
另據監管機構NewsGuard的專家分析,OpenAI最新版本的GPT-4大型語言模型在輸出信息方面,確實比它的前身GPT-3.5還要糟糕。在今年3月份發布的報告中,NewsGuard就指出,GPT-4不僅在其研究人員的提示下回答了完全虛假的新聞敘述,而且甚至比GPT-3.5回答的內容更差。
封面圖片來源:視覺中國
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP