每日經濟新聞 2023-12-07 10:06:17
每經編輯 杜宇
OpenAI空前崛起之際,谷歌毅然打響了絕地反擊戰。
當地時間12月6日,谷歌公司宣布推出其規模最大、功能最強大的新大型語言模型Gemini,其最強大的TPU(張量處理單元)系統“Cloud TPU v5p”以及來自谷歌云的人工智能超級計算機。v5p是今年早些時候全面推出的Cloud TPU v5e的更新版本,谷歌承諾其速度明顯快于v4 TPU。
值得一提的是在MMLU(大規模多任務語言理解)測試中,Gemini Ultra以90.0%的高分,首次超過了人類專家。
據界面新聞12月7日報道,Gemini 1.0是谷歌籌備了一年之久的GPT4真正競品,也是目前谷歌能拿出手的功能最為強悍、適配最為靈活的大模型,包括三種不同套件,分別是Gemini Ultra,Gemini Pro和Gemini Nano。
其中Ultra的能力最強,復雜度最高,能夠處理最為困難的多模態任務;Pro能力稍弱,是一個可擴展至多任務的模型;Nano則是一款可以在手機端側運行的模型。這說明,Gemini的觸達范圍很廣,可以下探至數據中心,也可以上行至移動設備端側。
Gemini模型經過海量數據訓練,可以很好識別和理解文本、圖像、音頻等內容,并可以回答復雜主題相關的問題。所以,非常擅長解釋數學和物理等復雜學科的推理任務。
Gemini可以生成和理解Python、Java、C++和Go等主流代碼。Gemini Ultra在多個編碼基準測試中表現出色,包括HumanEval,這是評估編碼任務性能的重要行業標準。
谷歌還基于Gemini模型開發了專業的代碼模型AlphaCode 2。與前一代相比,AlphaCode 2的性能提升了至少50%以上。
Gemini的多模態功能,使其能在視覺理解、文本生成等方面有非常強的功能。例如,從數十萬字的小說中整理出重要觀點,從200頁的金融報告中找出最有價值的內容。這對于金融、科技、醫療的科研和業務人員來說幫助巨大。
在一段公布的演示視頻中,桑達爾?皮查伊展示了Gemini對視頻、圖像的非同凡響的識別能力。在視頻中,Gemini極為自如地在圖像、音頻、視頻各模態之間的轉換,展現了驚人的解鎖應用場景與產品形態的潛力。
圖片來源:谷歌演示視頻
僅從谷歌釋出的演示視頻結果看,市面上現有的全部多模態大模型與Gemini的性能表現都有代際差,包括Meta 5月開源的跨6個模態的AI模型ImageBind以及GPT-4。
圖片來源:谷歌
一年前,在人工智能開發機構OpenAI發布聊天機器人ChatGPT后,創造了當前人工智能熱潮背后大部分基礎技術的谷歌措手不及,一度發布了內部“紅色警報”(red code)。一年零一周后,谷歌似乎準備好了反擊。
據澎湃新聞,谷歌DeepMind首席執行官、Gemini團隊代表德米斯·哈薩比斯(Demis Hassabis)在發布會上正面談及GPT-4與Gemini的對比,“我們對系統進行了非常徹底的分析,并進行了基準測試。谷歌運行了32個完善的基準測試來比較這兩個模型,從廣泛的整體測試(如多任務語言理解基準測試)到比較兩個模型生成Python代碼的能力。”哈薩比斯略帶微笑地表示,“我認為我們在32項基準中的30項中大幅領先。”
從發布日起,Gemini可開始應用于Bard和Pixel 8 Pro智能手機,并將很快與谷歌服務中的其他產品集成,包括Chrome、搜索和廣告等。
目前,谷歌計劃通過谷歌云將Gemini授權給客戶,供他們在自己的應用程序中使用。12月13日開始,開發者和企業客戶可以通過谷歌AI Studio或谷歌Cloud Vertex AI中的Gemini API(應用程序編程接口)訪問Gemini Pro,安卓開發人員可以使用Gemini Nano完成構建。
據介紹,Gemini Ultra是第一個在MMLU(大規模多任務語言理解)方面超越人類專家的模型,該模型綜合使用數學、物理、歷史、法律、醫學和倫理學等57個科目來測試世界知識和解決問題的能力,谷歌在一篇博客文章中表示,它可以理解復雜主題中的細微差別和推理。
而據CNBC報道,谷歌高管們在新聞發布會上表示Gemini Pro的表現優于GPT-3.5,但回避了與GPT-4相比如何的問題。對于谷歌是否計劃對Bard Advanced的訪問收費,Bard總經理蕭茜茜(Sissie Hsiao)表示,谷歌專注于創造良好的體驗,目前還沒有任何相關盈利的細節。
與新模型一起亮相的,還有新版本的TPU芯片TPU v5p,旨在減少訓練大語言模型相關的時間投入。TPU是谷歌為神經網絡設計的專用芯片,經過優化可加快機器學習模型的訓練和推斷速度,谷歌于2016年起開始推出第一代TPU。
據谷歌介紹,與TPU v4相比,TPU v5p的浮點運算性能提升了兩倍,在高帶寬內存方面提高了3倍。使用谷歌的600 GB/s芯片間互連,可以將8960個v5p加速器耦合在一個Pod(通常指一個包含多個芯片的集群或模塊)中,從而更快或更高精度地訓練模型。作為參考,該值比TPU v5e大35倍,是TPU v4的兩倍多。
谷歌稱,TPU v5p是其迄今為止最強大的,能夠提供459 teraFLOPS(每秒可執行459萬億次浮點運算)的bfloat16(16位浮點數格式)性能或918 teraOPS(每秒可執行918萬億次整數運算)的Int8(執行8位整數)性能,支持95GB的高帶寬內存,能夠以2.76 TB/s的速度傳輸數據。
谷歌表示,所有這些意味著TPU v5p可以比TPU v4更快地訓練大型語言模型,如訓練GPT-3(1750億參數)這樣的大語言模型速度比TPU v4快2.8倍。
除了新硬件之外,谷歌還引入了“人工智能超級計算機”的概念。谷歌云將其描述為一種超級計算架構,包括一個集成系統,具有開放軟件、性能優化硬件、機器學習框架和靈活的消費模型。
谷歌計算和機器學習基礎設施部門副總裁馬克·洛邁爾(Mark Lohmeyer)在博客文章中解釋道,“傳統方法通常通過零碎的組件級增強來解決要求苛刻的人工智能工作負載,這可能會導致效率低下和瓶頸。”“相比之下,人工智能超級計算機采用系統級協同設計來提高人工智能訓練、調整和服務的效率和生產力。”這可以理解為,與單獨看待每個部分相比,這種合并將提高生產力和效率。換句話說,超級計算機是一個系統,其中任何可能導致性能低下的變量(硬件或軟件)都受到控制和優化。
每日經濟新聞綜合澎湃新聞、界面新聞、公開資料
封面圖片來源:視覺中國-VCG111288485345
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP