每日經濟新聞 2024-03-12 21:51:40
◎ 阿爾特曼、黃仁勛在不同場合表示,AGI或在五年內實現。
每經記者 李孟林 每經編輯 蘭素英
“五年內,AGI很可能就會到來。”這不是科幻小說的情節,而是業界大佬的預言。
近日,隨著Anthropic最新一代大模型Claude 3被曝表現出“自我意識”,以及馬斯克正式起訴OpenAI及其首席執行官山姆•阿爾特曼,AGI(通用人工智能)再次成為AI屆熱議的話題。在對OpenAI的起訴書中,馬斯克稱OpenAI的GPT-4系統已經實現了AGI,不過OpenAI直接予以了否認。
這一系列事件讓外界產生了一種錯覺:AGI似乎真的不遠了。阿爾特曼和英偉達CEO黃仁勛也相繼表示,AGI可能在5年內實現。
然而,在沸沸揚揚的議論中,何謂AGI仍然是一個莫衷一是的概念。作為DeepMind的首席AGI科學家,Shane Legg曾是首批將這一概念引入計算機科學界的人之一。近期,他與同事聯合發表了一篇論文,從六個方面定義了AGI,并劃分了六個等級,為公眾厘清AGI提供了參考。
由OpenAI前員工創建、獲亞馬遜大力支持的初創企業Anthropic最近推出了最新一代的大模型Claude 3.0,在許多關鍵指標與OpenAI最新的GPT-4打平甚至超越后者。
更有趣的是,該公司的員工Alex Albert在X平臺(原推特)上表示,該系列模型的最強版本Claude 3 Opus在測試過程中,識別到人類在對其進行測試,展現出“自我意識”的跡象。
具體而言,測試人員在一大堆話題中插入了一個完全不相關的披薩配料問題,Claude 3 Opus表示:“我懷疑這個披薩配料‘事實’插入進來是一個玩笑,或者測試我是否在集中注意力,因為它跟其他問題完全不相匹配。”不少AI研究人員表示,這個模型展現出了“對思考進行思考”的元認知能力,自我意識進入到了一個新水平,似乎是朝向更高級的AGI邁了一步。
在此之前,OpenAI推出了“王炸級”文本生視頻模型Sora,并將其定義為可以生成視頻的世界模型(World Simulators),并認為這是打造通用世界模型的潛在方法之一。圖靈獎得主、Meta的首席AI科學家楊力昆(Yann LeCun)一直認為,要實現AI的智能突破,需要一個能理解周遭世界的世界模型,才能最終通往AGI,而這也正是當前的大語言模型所缺乏的。
除開技術方面的進步,近期馬斯克對OpenAI的起訴也將焦點之一對準了AGI。馬斯克在起訴書中表示,GPT-4已經可以被當作早期的AGI,但是其內部細節只有OpenAI和微軟才知道。這一說法是基于微軟自己的評估。2023年3月,微軟研究員在一份預印本論文中表示,GPT-4在很多能力上與人類持平或更強,已經有了AGI的“火花”。
所有這些讓外界對AGI有了更強的期待,難道AGI真的離走進現實不遠了?對此,部分業界大佬似乎有著樂觀的預期。
OpenAI CEO阿爾特曼在電子書《我們的AI旅途》中的采訪中提到,AGI可能在五年內實現。“5年左右,也許會稍長一些。沒有人能說出一個確切的時間,也沒有人知道它對社會的影響到底是什么。”阿爾特曼表示。“當AI能夠獨立完成創新的科學突破時,它就能被稱為AGI了。”
與阿爾特曼不謀而合的還有英偉達的CEO黃仁勛。他在近期的一個論壇上表示,如果把AGI標準定為通過人類創制的各種測試的話,那么不出5年,AI就可以通過任何人類測試。當前的AI可以通過律師考試,但對胃腸病學等專業醫療測試仍然表現不佳。
但在樂觀的氛圍之外,也有人在潑冷水。紐約大學教授Gary Marcus就表示,依靠不斷提高大模型的數據量并非解決AI現存問題的方法,芯片領域的摩爾定律不一定會在AI領域復現,大模型并非通往AGI的答案,AI需要的是范式轉換。楊力昆同樣認為,要實現人類水平的AI,當前的大語言模型是走了岔路,因為其實質是預測下一個單詞,而無法謀劃和推理。
1965年,AI研究先驅Herbert Simon曾樂觀地預測,20年之內機器就可以完成人類的任何工作。很顯然,現實離Simon的預測相差甚遠。
AGI到底是什么?
正如許多前沿科學的關鍵概念一樣,AGI的標準可謂眾說紛紜,且其內涵一直在隨著研究的進展不斷變化。但有一點可以肯定的是,正如其名字“通用人工智能”所示,AGI一定是相對只能完成某種特定任務如下圍棋或者翻譯的“狹義”AI而言的。
在AGI概念之前,學術界對達到人類水平或以上的討論集中在哲學界,如著名的“圖靈測試”或哲學家約翰•賽爾提出的“強人工智能”等概念。1997年,北卡羅萊納大學的物理學家Mark Gubrud首次提出了AGI這個概念。在他的定義中,AGI指的是在復雜程度和速度上可以和人腦媲美的AI系統,可以獲取一般性知識,并以其為基礎進行操作和推理,可以在任何工業或軍事活動中發揮人類智力的作用。
OpenAI在其組織章程中,將AGI定義為“可以在大多數經濟上有價值的工作中超越人類的高級自動系統”。谷歌研究院副總裁Blaise Agüera y Arcas則認為,AGI的關鍵指標在于“通用性”,既然當前的大模型已經能夠討論大多數問題,處理多種模態的信息輸入輸出,這就是已經是AGI了。
“如果你邀請100個AI專家來定義AGI,你可能會得到100個相互關聯但又不同的定義。”2023年11月,知名AI公司DeepMind聯合創始人、首席AGI科學家的Shane Legg及公司研究人員在一篇論文中表示。2002年,Legg便開始在計算機界普及AGI概念,按照他當時的定義,AGI是指在認知任務上能取得類人表現的機器智能。
而在最新的這篇論文中,Legg及其同事試圖建立一個評估AGI的概念框架,是當前AI界對于AGI問題最深入的探討之一。他們梳理了現在的AGI定義,并從中提取了6個AGI應該滿足的原則,然后以類似自動駕駛分級的方式,給AGI的性能劃分了五個階段。
然而,這篇論文并沒有給出AGI的定義,只是給出了定義AGI的六項原則。具體而言:
1、注重能力,而非過程:即只考慮AI系統完成任務的能力,而不考慮系統的推理過程是否像人腦一樣思考,也不討論系統是有“意識”和“感知能力”。
2、注重通用性與性能:既要考慮AI系統的通用性(寬度),也要考慮其性能水平(深度)。Blaise Agüera y Arcas的標準就過度關注通用性,而忽視了性能標準。
3、注重認知與元認知任務:即聚焦在非實體的“認知”活動上,暫不考慮AI系統“具身化”到機器人系統,從而在現實世界操作的能力。
4、專注于潛力而不是實際應用:即AI系統需要具備某種能力的潛能即可,不需要在現實世界中達到此種效果,因為后者涉及社會、法律、倫理等多種因素制約。
5、重視實際適用性:指評價AGI的標準應該是完成現實世界中人類覺得有價值的任務。
6、關注實現AGI的路徑,而非單一終點:即將AGI的能力分為多個層級,而非單個的門檻標準,從而能容納多種AGI的定義方式。
按照最后一個原則,該論文也將AGI分為了L0到L5六個等級,分別為:無AI,初現,合格,專家,大師和超人類。論文認為,2023年推出的ChatGPT、谷歌Bard、Meta的Llama 2,即當前主要的大模型,還處在L1階段,也就是和未經訓練的普通人差不多或稍好一點。后四個等級的AGI都還沒有出現。接下來的L2到L5級別,分別對應超越50%、90%、99%和100%的有技巧成年人。
封面圖片來源:新華社記者 金立旺 攝
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP