每日經濟新聞 2023-04-24 22:26:54
每經記者 文巧 李孟林 蔡鼎 譚玉涵 每經編輯 高涵 盧祥勇
ChatGPT掀起的生成式人工智能(AI)競爭如火如荼,谷歌正在奮力追趕。
當地時間4月20日,據路透社報道,谷歌母公司Alphabet Inc宣布了一項重大的重組,將合并旗下兩個主要的AI研究部門——DeepMind和谷歌研究院的Google Brain,以便于幫助該公司在AI領域的競爭中取得優勢。
谷歌的焦急之態愈發明顯,另一邊,微軟在大型語言模型上的布局隨著媒體的不斷爆料也越發清晰——早在2019年左右,微軟就開始醞釀取代英偉達芯片的計劃。在芯片短缺且成本高昂的情況下,微軟選擇自研芯片的確不失為一條出路。實際上,谷歌也早在2016年就發布了第一代TPU芯片。
一位不愿具名的硅谷工程師告訴《每日經濟新聞》記者,谷歌的模型都是用TPU訓練的,相對于英偉達的GPU來講,優勢在于芯片級別的互聯性特別高。鑒于當前用電連接芯片的損耗過高,一個潛在的方案是光互聯。
AI戰事愈演愈烈,谷歌和微軟都使出渾身解數,以期在這場競賽中不落下風。但最近,OpenAI首席執行官Sam Altman的一席話卻令業界嘩然。
在最近麻省理工大學的一場活動上,OpenAI首席執行官Sam Altman表示,巨型AI模型時代即將終結。
實際上,Altman所說并非沒有道理,為了幫助OpenAI訓練ChatGPT,微軟耗資數億美元為其量身打造了超算,如此的高成本早已注定了這只是一場少數人的游戲。
上述硅谷工程師告訴記者,業內不應當只看當下的商業利益,他也在嘗試勸說國內幾個大佬放棄當下訓練解決具體場景的大模型的思路。“我希望這個行業少一點競爭,大家直奔通用人工智能而去。如果說這是市場共識,就不會有300個公司,可能就只有具有長遠遠景的幾家公司往這個方向努力。”他說道。
同時,隨著AI之戰更加白熱化,就連醫藥公司也坐不住了。當地時間4月20日,美國生物技術公司莫德納在官網宣布與IBM公司達成一項協議,將合作探索使用量子計算和AI等下一代技術,加速推進mRNA的研究。
在此背景下,AI競賽的出路究竟在何方?《每日經濟新聞》記者連線硅谷工程師等業內人士進行解答。
谷歌重大重組 將生成式AI引入廣告
DeepMind和谷歌研究院的Google Brain合并,是谷歌追趕OpenAI和微軟的最新舉措。
DeepMind成立于2010年,因其研發的AlphaGo人工智能圍棋程序擊敗了韓國圍棋九段棋手李世乭而聲名大噪。2014年,谷歌以5億美元的價格收購了DeepMind,其后DeepMind 一直作為獨立部門進行運營。2015年,谷歌聯合創始人Larry Page宣布成立Alphabet,目的是讓新業務獨立于谷歌運營,Alphabet將這些新業務叫作“other bets”,它們仍然隸屬于谷歌公司。DeepMind 一直是Alphabet的“other bets”之一。
過去十年,DeepMind在AI方面的集體成就涵蓋了AlphaGo、word2vec、WaveNet、AlphaFold、深度強化學習等,以及用于表達、訓練和部署大規模機器學習模型的分布式系統和軟件框架,如TensorFlow 和 JAX;而 谷 歌 大 腦(Google Brain)也已經交付了許多備受矚目的項目,其中包括Transformer,這項技術也是ChatGPT創建的基石。
據報道,負責監督Google Brain團隊的谷歌研究院前任主管Jeff Dean將轉任新設立的首席科學家職位,并領導該公司“與AI有關的最關鍵和最具戰略性的技術項目”,包括一系列新的強大AI項目。
谷歌首席執行官Sundar Pichai當天在一篇博文中表示:“在谷歌計算資源的支持下,將所有這些人才整合成一個專注的團隊,將大大加快我們在AI方面的進展。”
此外,據《金融時報》4月20日報道,谷歌還計劃在未來幾個月內將生成式AI技術引入其廣告業務,如此便可制作更加復雜的廣告內容,效果甚至可以媲美廣告公司制作的專業內容。據悉,目前谷歌已經在其廣告業務中使用AI技術來生成簡單的提示,從而鼓勵用戶購買其產品。
根據內部文稿所展示的內容,廣告商可以提供與特定廣告活動相關的內容,如圖像、視頻和文本,然后人工智能將識別和整理這些材料,根據目標受眾群體和廣告商所要求的銷售目標來生成一份廣告。
微軟自研芯片 秘密研發“雅典娜”5年?
自ChatGPT誕生以來,因與OpenAI結盟,微軟的AI事業正乘著ChatGPT的東風扶搖直上。眼看ChatGPT這把火越燒越旺,從聊天機器人Bard到將AI融入辦公系統Workspace,谷歌已頻繁亮出“殺手锏”。
谷歌的焦急之態從拉響“紅色警報”起就愈發明顯,而另一邊,微軟在大型語言模型上的布局,隨著媒體的不斷爆料也越發清晰——早在2019年左右,微軟就開始醞釀取代英偉達芯片的計劃。
當地時間4月20日,據The Information最新報道,實際上早在大約5年前,微軟就開始秘密研發一種內部代號為“雅典娜”(Athena)的芯片,研發人數總共300人。
微軟選擇自研芯片的原因很簡單,算力實在太貴了。據The Information報道,為了幫助OpenAI訓練ChatGPT,微軟將3萬多個英偉達A100芯片連接起來,耗資數億美元為OpenAI量身打造了超算。
目前,英偉達GPU A100和H100仍是訓練大模型最主流的GPU芯片。據IDC估計,GPU芯片占AI算力的90%,而英偉達占GPU市場的80%。市場研究機構TrendForce推算,處理ChatGPT的訓練數據需要2萬枚GPU芯片,隨著OpenAI進一步展開 ChatGPT和其他GPT模型的商業應用,其GPU 需求量將突破3萬張(該報告計算以A100為主)。強大的市場需求和供貨量的缺少使得整個科技行業都面臨芯片短缺的問題。
“并不是說(A100芯片)完全無法被替代,但是它的通用性比較強,大家用起來很方便很順手,是最適合用來訓練的,”長期關注芯片產業的集微咨詢資深分析師錢禹告訴《每日經濟新聞》。
現在,微軟想要繼續開發GPT-4以及GPT-4之后模型的商業應用,必定需要大量的算力支持。
據報道,開發“雅典娜”的成本約為每年1億美元。SemiAnalysis首席分析師Dylan Patel表示,ChatGPT的運營成本大概是每天70萬美元,每次查詢的成本大概為0.36美分。如果OpenAI用上微軟自研芯片,成本能直降三分之一。據預測,微軟可能最早在明年大面積應用“雅典娜”芯片。
印度裔CEO納德拉 能否帶領微軟重回巔峰?
談到微軟發力AI,就不得不提及微軟第三任掌舵——55歲的印度裔CEO薩提亞·納德拉。從2014年2月4日出任CEO至今,納德拉治下的微軟市值已從3000億美元以下攀升到目前的2萬億美元以上。
要知道,微軟曾經是全球市值第一的公司,1999年就創造過6205.8億美元的階段性市值紀錄,但由于錯失了移動互聯網時代,微軟市值逐步萎縮至3000億美元以下的水平。而正是得益于納德拉上任后手術刀式的內外改革,才讓目前微軟市值重回第一陣營。
2014年成為CEO后,納德拉調轉了微軟船頭,他認為,“微軟應該轉向‘cloud first,mobile first(云優先、移動優先)’,不再是以個人計算機為先,甚至也不是手機為先。在一個‘云優先、移動優先’的世界里如何讓微軟實現成功,是我們面臨的共同挑戰。”他砍掉了不賺錢的手機業務組,布局微軟2B業務的公司走向,讓Office、微軟云與AI成為公司研發的重點。
從那時起,納德拉逐步帶領微軟重拾業界地位。在短短三年半的時間里,他讓微軟的市值增長超過2500億美元。得益于不俗的公司業績表現,2021年10月,微軟八年來首次將蘋果擠下最高市值寶座。也正是在那年年中,微軟董事會全票通過納德拉擔任公司新任董事長。
作為硅谷最具代表性的印度裔高管之一,微軟創始人比爾·蓋茨曾這樣評價納德拉:“納德拉是一位公認的領導者,他擁有超強的工程師技能、商業眼光和將眾人團結起來的能力”。一語概括了一名科技公司CEO應該具有的三個特質:技術過硬,商業頭腦,人際把控能力。可以說是“軟”“硬”兼備。
事實上,納德拉的成長之路并非一帆風順。1967年出生在印度第四大城市海德拉巴的納德拉,父親是公務員,母親是大學教師。15歲時,納德拉去了海德拉巴公立學校,隨后在印度理工學院(IITs)的入學考試中失敗了。IITs是當時所有印度學生的最高夢想。退而求其次,納德拉在馬尼帕爾理工學院學習電氣工程,并在成年后成為了第一代移民來到美國。
在美國期間,納德拉選擇攻讀計算機科學的研究生學位,不過他并未入讀斯坦福大學或者麻省理工,而是去了威斯康星大學密爾沃基分校。在高手如云的科技公司,他的學歷背景不算突出。畢業后,納德拉在發明Java語言的公司太陽微系統工作了幾年,后于1992年加入微軟,當時的納德拉年僅25歲。
雖然學歷背景不算突出,但納德拉走的是差異化競爭這條路。他很早就表示,不想做一個純粹的技術人員。納德拉的同學曾問他,為什么不讀一個博士學位?他回答說:“我要做招聘博士的人。”1997年,也就是在加入微軟5年后,納德拉完成了芝加哥大學的MBA項目,向著他理想的路徑邁出一大步
納德拉后來成為微軟企業暨云計算部門負責人,在微軟在線研究與開發部門和微軟商業部擔當副總裁一職。他主導的Microsoft Azure企業業務大獲成功。Azure是微軟云計算部門的核心,在云基礎設施市場僅次于亞馬遜AWS,領先谷歌。Azure已是微軟新的創收利器,每個季度都保持了超過90%的營收增長率。
在這一波由ChatGPT引領的AI浪潮之下,微軟之所以能率先吃到螃蟹,也是因為納德拉接過了當初OpenAI拋出的橄欖枝。
至今,微軟已經累計向OpenAI投資約130億美元。在去年12月的微軟年度股東大會上,納德拉還表示:“即便是當今最流行的人工智能應用程序之一ChatGPT,也都是在Azure超級計算機上訓練的。”
巨型模型將終結 光互聯芯片才是出路?
對于渴望分到一杯羹的科技廠商來說,“現在問題是買不到芯片。對于目前訓練大模型的主流芯片,例如英偉達GPU A100和(更新一代的)GPT H100,市場上所有的公司都在搶貨。一個公司能搶到多少?”前述工程師表示。
在芯片短缺且成本高昂的情況下,微軟選擇自研芯片的確不失為一條出路。而實際上,谷歌早在2016年就發布了第一代TPU芯片,相比GPU方案,功耗和成本都大幅降低。
前述工程師告訴記者,谷歌的模型都是用TPU訓練的,相對于英偉達的GPU來講,優勢在于芯片級別的互聯性特別高。“一個TPU的Porte,相當于是內部互聯程度互通程度非常高的一個集群,里面是有幾千個芯片的,并能提供非??斓挠嬎隳芰?。英偉達的GPU目前還不可以,但是他們其實也在往這個方向發展。”他說道。
此外,鑒于當前用電連接芯片的損耗過高,一個潛在的方案是光互聯。“也就是用光纖連接,損耗基本上可以接受,而且延時也非常低。”前述工程師說道,對于國內芯片公司來說,這也是可以考慮發展的一個方向。
“重要的是,在做技術選型的時候,你去瞄準當下還是瞄準未來。國內芯片公司可以借鑒谷歌對未來5~10年的計算能力需求的想法,參考谷歌的TPU設計,并且考慮光互聯的路子。”他告訴記者。
隨著AI戰事愈演愈烈,國內科技廠商都正使出渾身解數,以期在這場競賽中不落下風。但在最近麻省理工大學的一場活動上,OpenAI首席執行官Sam Altman卻表示,巨型AI模型時代即將終結。他表示,AI技術進一步的進展將不會來自于將模型做大。“我認為我們正處于巨型模型時代的盡頭,最終我們將以其他方式使它們變得更好。”
這一席話卻令業界嘩然。畢竟,自ChatGPT誕生以來,不論是海外還是國內都引發了生成式AI和大型語言模型的狂潮。國外,微軟、谷歌鏖戰正酣,An-thropic、AI21、Cohere和Character.AI在內的眾多資金雄厚的初創公司也正在投入巨大的資源努力追趕上OpenAI。
在國內,從百度3月份發布“文心一 言”以來,多家互聯網大廠、AI企業和初創團隊競相宣布了自家的大模型或計算平臺。不少人感慨,中國互聯網產業已經有十年沒有如此“卷”過了。
但實際上,訓練模型的高成本早已注定了這只是一場少數人的游戲。前述硅谷工程師也告訴記者,業內不應當只看當下的商業利益,他也在嘗試勸說國內幾個大佬放棄當下訓練解決具體場景的大模型的思路,而是直奔GPT-5的方向,即通用人工智能的方向而努力。
“不是說我希望國內公司全都能訓練出通用人工智能出來,我希望的是這個行業少一點競爭,大家直奔通用人工智能而去。如果說這是市場共識,可能就只是具有長遠愿景的幾家公司往這個方向努力,而不是幾百個公司都在做大模型。”他解釋道,“這樣出來的模型,其實泛化能力會比原先的要好。”
莫德納瞄準AI 聯手IBM加速mRNA研究
隨著AI之戰愈演愈烈,就連醫藥公司也坐不住了。
當地時間4月20日,美國生物技術公司莫德納在官網宣布與IBM公司達成一項協議,將合作探索使用量子計算和AI等下一代技術,加速推進mRNA的研究。
據悉,IBM的人工智能模型“MoLFormer”可以幫助科學家們了解潛在mRNA藥物的特征,兩家公司將結合最先進的配方與生成式AI來設計具安全性和有效性的mRNA藥物。
根據兩家公司的協議,莫德納將加入IBM量子加速器計劃和IBM量子網絡。IBM方面則將向莫德納提供量子計算系統的訪問權限,協助其探索和創造新的mRNA疫苗和療法。
新冠疫情暴發后,莫德納因其研發生產的mRNA疫苗與輝瑞疫苗成為全球最主流的一批新冠疫苗而名聲大噪。隨著全球對新冠疫苗的需求放緩,莫德納正試圖擴展mRNA技術平臺的臨床應用以治療其他疾病。
據報道,近年來,隨著量子計算和AI技術與生物醫藥技術的結合不斷深入,極大地促進了生物基礎科研的進步和藥物研發的效率。去年,谷歌AlphaFold人工智能軟件成功預測了人體幾乎所有的蛋白質結構,意味著人工智能開始攻克生物科學和醫學領域的重大難題。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP