每日經濟新聞 2024-04-17 12:45:20
每經記者 李孟林 每經編輯 何小桃 蘭素英
“大模界”是每日經濟新聞推出一檔專注生成式AI與大模型技術的前沿科技報道欄目。
在這里,我們將聚焦生成式AI技術浪潮,展現從文字、圖像、音頻、視頻的大模型如何編織數字化世界。
在這里,我們將解碼、評測國內外各類大模型,探究它們如何成為變革各行各業的重要力量。
在這里,我們將關注AIGC行業發展,聯手行業領軍人物和頂尖專家,共同揭示最新產品創新和技術突破,前瞻未來發展趨勢。
歡迎關注“大模界”,您將見證AIGC如何重塑內容生態,如何以前沿之力推動社會進步。讓我們共同開啟一場關于AI新紀元的無限旅程!
《2024 年人工智能指數報告》 圖片來源:報告截圖
當地時間4月15日,斯坦福大學“以人為本”人工智能研究院(Human Centered Artificial Intelligence,簡稱HAI)發布了第七個年度AI Index報告,這是關于AI行業現狀的最全面的報告之一。
報告稱,今年的報告是迄今為止覆蓋面最廣的,恰逢AI對社會的影響力達到前所未有的重要時刻。從內容上看,報告長達300多頁,不僅追蹤了AI技術的進步情況、公眾感知度、AI訓練成本、倫理監管等常規話題,也加入了AI對科學和醫學領域影響的新章節。
圖片來源:報告截圖
HAI成立于2019年,由著名AI科學家李飛飛與哲學教授約翰·埃切曼迪聯合擔任院長,致力于推動人工智能領域的跨學科合作。今年的AI Index報告同樣秉承這樣的精神,邀請來自于斯坦福大學多個學院的不同學科專家撰寫,并得到了谷歌、OpenAI等業界巨頭的支持,以及埃森哲、GitHub、麥肯錫等機構在研究和分析上的協助。
AI Index報告旨在用無偏見、嚴格篩選、廣泛采納的數據,為政、學、商和大眾提供全面且精細的AI趨勢解讀,已成為各國政策制定者、學院研究和新聞媒體參考的權威行業報告。
以下是《每日經濟新聞》記者梳理的十大關鍵信息:
1.開源大模型數量激增,但性能不及閉源
整個2023年共有149個基礎模型發布,是2022年發布數量的兩倍以上。在這些新發布的模型中,65.7%是開源的,相比之下,2022年僅為44.4%,2021年則為33.3%。然而,在10個AI基準測試中,閉源模型的性能優于開源,性能優越的中位數為24.2%。
圖片來源:報告截圖
谷歌在2023年發布的基礎模型最多,達18個,其次是Meta(11個)、Microsoft(9個)、OpenAI(7個)。2023年發布基礎模型最多的學術機構是加州大學伯克利分校(3個)。
圖片來源:報告截圖
2023年,企業界發布了51個重要的機器學習模型,而學術界僅貢獻了15個。此外,2023年產學研合作成果的模型數量也創下新高,達到21個。
2.AI模型訓練“燒錢”加劇
最先進的AI模型的訓練成本已達到前所未有的水平。例如,OpenAI的GPT-4訓練據估計耗費了價值7800萬美元的計算資源,而谷歌Gemini Ultra的訓練成本則高達1.91億美元。作為對比,2017年Transformer模型訓練成本約為900美元。2019年發布的RoBERTa Large訓練成本約為16萬美元。
圖片來源:報告截圖
3.頂級模型數量美國領先,專利數量中國領跑
從區域競爭來看,美國在頂級AI模型方面領先于中國、歐盟和英國。2023年,來自美國機構的知名AI模型數量為61個,超過歐盟的21個和中國的15個。
圖片來源:報告截圖
不過,在AI專利方面,中國處于領先位置。2022年,中國以61.1%的比例領跑全球AI專利來源地,遠超美國(20.9%)。對比2010年,當時美國在AI專利方面的占比高達54.1%。
圖片來源:報告截圖
4.AI在復雜任務上的表現仍落后人類
在圖像分類、視覺推理和英語理解等方面,AI的表現已經優于人類。然而,在更復雜的任務上,例如競賽級別的數學、視覺常識推理和規劃,AI的表現仍然落后于人類。
圖片來源:報告截圖
與此同時,在既有的基準測試(例如ImageNet、SQuAD 和 SuperGLUE)上,AI模型的性能已經趨于飽和。2023年出現了幾個具有挑戰性的新基準測試,包括用于編碼的SWE-bench、用于圖像生成的HEIM、用于通用推理的MMMU、用于道德推理的 MoCa、用于基于代理的行為的AgentBench以及用于檢測幻覺的HaluEval。
5.缺乏嚴格、標準化的AI責任評估方法
隨著深度偽造、版權糾紛、隱私安全等問題逐漸凸顯,報告顯示,當前嚴重缺乏嚴格且標準化的負責任AI評估方法。OpenAI、谷歌和 Anthropic等行業領袖使用不同的負責任AI基準測試來評估他們的模型,這種做法使人們難以系統地比較頂級AI模型的風險和局限性。
圖片來源:報告截圖
報告新引入的“基礎模型透明度指數”顯示,AI開發企業缺乏透明度,尤其是在訓練數據和方法披露方面。這種開放性的缺乏阻礙了人們進一步了解AI系統的嚴密性和安全性。
6.生成式AI投資增長近8倍
盡管2023年整個AI領域的投資有所下降,但生成式AI領域的私人投資卻在激增,在2022年的基礎上幾乎增長了八倍,達到252億美元。OpenAI、Anthropic、Hugging Face和Inflection等領軍企業都宣布了大規模的融資輪次。
圖片來源:報告截圖
從區域來看,美國作為AI私人投資的領導者,優勢地位進一步擴大。2023年,美國的AI投資達到672億美元,增長22.1%,歐盟和中國的AI投資處于下滑態勢。盡管全球AI投資連續第二年下降,但新成立的AI公司數量卻激增至1812家,比2022年增長了40.6%。
7.AI降本增效能力初顯
麥肯錫2023年的報告顯示,目前55%的受訪組織至少在一個業務部門或職能中使用了AI(包括生成式AI),高于2022年的50%和2017年的20%。42%的受訪組織報告實施AI后降低了成本,59%的受訪組織報告了收入增長。與2022年相比,報告成本降低的受訪組織比例增加了10個百分點。
圖片來源:報告截圖
2023年,多項研究評估了AI對勞動力的影響,表明AI使員工能夠更快地完成任務并提高產出質量。這些研究還展示了AI彌合低技能和高技能工人之間技能差距的潛力。
8.AI推動科學進步,醫學尤為突出
2023年,多個重大的科學相關AI應用出現,包括提高算法排序效率的AlphaDev,促進材料發現過程的GNoME。
在醫學領域,2023年出現了多個重要的AI醫療系統,例如用于增強大流行預測的EVEscape,以及輔助AI驅動將基因突變分類的AlphaMissence。AI正越來越多地被用于推動醫學進步。AI系統在MedQA基準測試(評估人工智能臨床知識水平的關鍵測試)上的表現也取得了顯著進步,2023年表現最出色的模型GPT-4 Medprompt準確率達到了90.2%,比2022年的最高分高出 22.6個百分點。
圖片來源:報告截圖
9.監管力度急劇增強
2023年有25項AI相關法規出臺,同比增長56.3%。美國和歐盟在AI政策方面取得里程碑式進展。歐盟就《人工智能法》條款達成一致,美國總統拜登簽署了一份關于AI的行政命令,這是當年美國最引人注目的AI政策舉措。
圖片來源:報告截圖
全球立法程序中提及AI的次數幾乎翻了一番,從2022年的1247次增加到2023年的2175次。2023年有49個國家的立法程序中提到了AI,而且每個大洲至少有一個國家在2023年討論了AI。對AI的限制性立法已經成為全球趨勢。
10.公眾對AI的認知在提高,緊張感也在增加
一份來自益普索的調查顯示,2023年,認為AI將在未來三到五年內顯著影響其生活的人口比例從60%上升到66%。多倫多大學的一項國際調查顯示,63%的受訪者知道ChatGPT。在那些知道的人中,大約有一半的人每周至少使用ChatGPT一次。
對AI感到緊張的人數比例在增加。益普索的調查中,有52%的人對AI產品和服務感到緊張,比2022年增加了13個百分點。在美國,皮尤研究中心的數據表明,有52%的美國人表示對AI的擔憂比興奮更多,高于2022年的38%。
公眾對AI帶來的經濟影響不太樂觀。在益普索的調查中,37%的受訪者認為AI將改善他們的工作,34%的人認為AI將促進經濟,32%的人認為AI將促進就業市場。
圖片來源:報告截圖
報告也報道了一些有趣的人口分布特點。比如,年輕人比老年人更相信AI對娛樂的豐富作用,高收入和教育程度高的人群對AI的正面潛力也更為樂觀。包括德國、荷蘭、澳大利亞、比利時、加拿大和美國等西方國家對AI產品和服務的正面評價最低,但這一現象在2023年有所好轉。
記者|李孟林
編輯|何小桃 蘭素英 蓋源源
校對|孫志成
|每日經濟新聞 ?nbdnews??原創文章|
未經許可禁止轉載、摘編、復制及鏡像等使用
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP