每日經濟新聞 2024-12-14 14:03:13
◎ 本周,AI界展開“軍備賽”,OpenAI、谷歌和馬斯克旗下xAI等科技巨頭相繼發布重磅AI產品,引發業界關注。這些創新涵蓋了AI視頻生成、多模態輸出和屏幕共享等多個領域。在第七天的活動上,OpenAI還故意放了個AGI(通用人工智能)的“彩蛋”。隨著AI大廠之間的競爭日趨白熱化,2025年AI的發展將呈現什么新的趨勢呢?《每日經濟新聞》記者采訪復旦大學計算機科學技術學院副教授鄭驍慶進行解讀。
每經記者 鄭雨航 每經實習記者 宋欣悅 岳楚鵬 每經編輯 蘭素英
本周,一場激烈的“軍備競賽”在AI界上演。
OpenAI自12月5日開啟的12天特別活動已經過去了一半,期間發布了不少驚喜,包括期待已久的AI視頻生成模型Sora、解鎖高級視頻對話和屏幕共享的ChatGPT,以及ChatGPT接入蘋果“全家桶”,賺足了外界的眼球。在第七天的活動上,OpenAI還故意放了個“彩蛋”:一個項目標注著“AGI(即通用人工智能,請勿現場演示)”,吸引了大量關注。
科技巨頭谷歌、馬斯克旗下xAI自然不會坐以待斃,也競相發布新產品。尤其是谷歌新推出的人工智能大模型Gemini 2.0 Flash,除了能生成文字外,還能直接生成圖片和語音,而且延遲還特別低。
在一系列新品的“轟炸”之下,用戶也是激動不已,紛紛涌入各大平臺,希望搶得一手體驗。哪知道,ChatGPT、Sora,以及Meta的一系列產品卻在本周出現了全球范圍的宕機,持續了數小時,讓用戶叫苦不迭。但OpenAI和Meta都沒有詳細說明服務中斷的原因,但據猜測,這與算力和服務器的需求激增有關。有行業人士介紹,在大模型時代,算力需求每2個月就要翻倍。
隨著AI大廠之間的競爭日趨白熱化,2025年AI的發展將呈現什么新的趨勢呢?復旦大學計算機科學技術學院副教授鄭驍慶在接受《每日經濟新聞》采訪時表示,“個性化”將是關鍵詞之一。
借著12天12場的新品活動,OpenAI在科技界掀起了一場前所未有的波瀾。xAI和谷歌自然也不會缺席這場盛宴,也相繼發布新產品,在這場年末狂歡中刷了一波存在感。
圖片來源:每經制圖
截至目前,OpenAI的這場圣誕特別活動已經過去一半,期間發布的產品不乏重磅之作,例如被OpenAI稱為“今年最重要的AI功能之一”的Projects In ChatGPT、等了300天才上線的視頻生成模型Sora 和“裝上眼睛”的ChatGPT。
Sora與今年2月發布的預覽版相比,則增加了文本生成視頻、動畫圖像和混合視頻等功能。用戶可生成分辨率高達1080p、時長最長為20秒的視頻。此外,用戶還可以導入自己的素材,用于擴展、重新混合或融合內容,甚至直接從文本生成全新的視頻。
知名數碼科技博主馬克·布朗利(Marques Brownlee)表示,Sora在風景鏡頭處理方面表現出色,能生成媲美專業素材的無人機航拍鏡頭。然而,這款產品仍存在一些局限性。比如,在物理模擬方面,模型對物體運動的理解還不夠深入,常常出現動作不自然、物體突然消失等問題。
ChatGPT的高級語音(Advanced Voice)模式也無疑是一大“王炸”,不僅支持實時視頻通話,還能實時共享屏幕和上傳圖像。這一技術迭代使得ChatGPT不僅能聽會說,還解鎖了視覺能力,通過攝像頭睜眼“看”世界,可以說“人味”十足。
在強化AI視覺理解能力方面取得進展的還有谷歌。在ChatGPT高級語音模式發布的前一天,多次在新品發布上遭遇OpenAI狙擊的谷歌也“放了大招”,官宣了新模型Gemini 2.0系列的“先頭兵”——Gemini 2.0 Flash。憑借強大的多模態輸出功能和良好的用戶體驗,Gemini 2.0總算是給谷歌扳回了一局。
有科技博主體驗后直接驚呼:這絕對是世界上首個真正把語音 + 視覺全模態能力做到實時、無卡頓感交互的AI模型。
面對競爭對手的強勁勢頭,OpenAI在接下來的活動中還將釋放什么驚喜呢?
在第七天(12月14日)的發布會上,OpenAI埋了個“彩蛋”:一個項目標注著“AGI(請勿現場演示)”,吸引了大量關注。此外,在用于演示的iPhone上,還似乎設置了一個名為“超級秘密AGI”的日歷活動,進一步增添了神秘色彩。
而在11日,OpenAI研究人員卡琳娜·阮(Karina Nguyen)在社交平臺上發布帖子時附上了一張新功能展示界面截圖,界面上出現了一個陌生的名字——ChatGPT ε。網友猜測,這極可能就是之前被傳出的下一代模型“獵戶座”(Orion)。網友還給出了“充分”的理由:天文學中,獵戶座腰帶上的中心恒星Anilam,用巴耶命名法表示正是獵戶座ε。
圖片來源:Reddit
新產品發布如火如荼,渴望搶先體驗的用戶也躍躍欲試。然而,讓人意想不到的是,OpenAI和Meta旗下產品卻出現了全球范圍的服務中斷。
當地時間12月11日下午3點左右,ChatGPT、Sora及API開始出現中斷。15分鐘后,OpenAI在X平臺上致歉。直到晚上9點,OpenAI才宣布基本恢復了服務。
圖片來源:X平臺截圖
中斷期間,一些用戶不停發出抱怨之聲,稱OpenAI嚴重耽誤了他們的工作了。有用戶不無調侃地表示:“ChatGPT宕機了,我現在不得不像個山頂洞人一樣備戰期末考試。”
而在ChatGPT和Sora宕機前約6小時,Meta旗下多個產品也出現“宕機”。上午10點,中斷數據追蹤網站Downdector報告的Facebook中斷數量激增至超過九萬七千份,Instagram的中斷報告數量激增至六萬七千份以上,其他Meta產品也出現了不同程度上的中斷。數小時后,問題得以解決。
圖片來源:X平臺截圖
OpenAI和Meta都沒有詳細說明服務中斷的原因,但有人猜測與算力和服務器的需求激增有關。
本周早些時候,Sora 一經開放便吸引了大量用戶,導致服務器一度被“擠爆”。許多注冊用戶無法生成視頻,并收到一條消息,稱“OpenAI的服務器已滿負荷”。
算力資源的不足在AI領域已經不是什么新鮮話題。有行業人士介紹,在“深度學習”時代之前,算力需求每24個月翻倍;在“深度學習”時代,算力需求每3至4個月翻倍;在大模型時代,算力需求每2個月就要翻倍。
目前,算力需求和算力基礎設施存在供需缺口。上個月,阿爾特曼就曾透露,由于計算能力的明顯短缺,GPT-5的發布將被推遲至明年。
隨著AI大廠之間的競爭日趨白熱化,2025年AI的發展將呈現什么新的趨勢呢?
復旦大學計算機科學技術學院副教授鄭驍慶在接受《每日經濟新聞》記者采訪時表示,“個性化”將是2025年AI發展的關鍵詞之一。
他對記者補充稱,要實現個性化和數據隱私之間的平衡,云+端的協作模式將成AI發展的趨勢。如果所有數據都在云端,會消耗大量算力。未來,需要快速響應的、涉及個人隱私的數據可能會在端側(如PC、智能手機),而需要更強計算能力才能解決的復雜問題,會上傳至云端進行計算。
美國硅谷風險投資公司a16z近期綜合公司50位合伙人洞察而發布的“Big Ideas in Tech for 2025”報告也對明年AI領域的發展進行了展望。
Justine Moore表示,AI將成為你的“第二大腦”。借助大語言模型(LLMs),每天產生的大量數字信息可以被整合為一個“數字大腦”。在未來,AI將成為一個無限記憶庫,記錄我們的想法,提供建議,指導個人成長。AI可以整理總結信息,生成數字日記,幫助我們進行更明智的決策。
而James da Costa提到,2025年,每個白領都將有一個AI助手幫助處理繁瑣任務,讓人們專注于更具創造性或戰略性的工作。未來,某些角色可能幾乎完全由AI agents(智能體)自動化完成。
Sarah Wang認為,2025年將是AI原生應用層崛起的一年。在大多領域內,最佳的創始團隊本質是應用AI的工程團隊。他們探索與模型互動的最佳方法,以解決客戶“最后一公里”難題。成功的AI應用可能會結合多個大模型+自訓練的小模型,提供從通用到有價值的AI體驗。未來成功的AI應用公司,絕不會被簡單視為“GPT套殼”。
Guido Appenzeller則表示,生成式AI將無處不在,AI不再僅運行在云端大服務器,也會運行在小型設備和應用上。
封面圖片來源:視覺中國-VCG31N2008742366
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP