頭條

重磅！“我們需要更大的GPU”，英偉達宣布推出最強AI芯片，成本和能耗較前代改善25倍

每日經(jīng)濟新聞 2024-03-19 07:09:32

每經(jīng)編輯畢陸名

號稱今年全球頭號人工智能（AI）領域開發(fā)者大會的英偉達2024 GTC AI大會于美東時間3月18日周一拉開帷幕。今年是英偉達時隔五年首次讓年度GTC重回線下，也是此前分析認為英偉達要“拿出點真家伙”的AI盛會。

當?shù)貢r間周一下午，英偉達創(chuàng)始人兼CEO黃仁勛在美國加州圣何塞SAP中心進行主題為“面向開發(fā)者的1#AI峰會”（1#AI Conference for Developers）演講。黃仁勛介紹了運行AI模型的新一代芯片和軟件。英偉達正式推出名為Blackwell的新一代AI圖形處理器（GPU），預計將在今年晚些時候發(fā)貨。

Blackwell平臺能夠在萬億參數(shù)級的大型語言模型（LLM）上構建和運行實時生成式AI，而成本和能耗比前身低25倍。

另據(jù)媒體報道，英偉達CEO黃仁勛在GTC宣布，將在其企業(yè)軟件訂閱中增加一款名為NIM的新產(chǎn)品。NIM可以更容易地使用舊的英偉達GPU進行推理，并允許公司繼續(xù)使用他們已經(jīng)擁有的數(shù)億個英偉達GPU。該產(chǎn)品將使新人工智能模型的初始訓練推理所需的算力更少。該公司的策略是讓購買英偉達服務器的客戶注冊英偉達企業(yè)版，每個GPU每年收取費用4500美元。黃仁勛表示，該軟件還將幫助在配備GPU的筆記本電腦上運行人工智能，而不是在云服務器上運行。

此外，英偉達CEO黃仁勛宣布推出下一代人工智能超級計算機，英偉達還發(fā)布6G研究云平臺，以便用AI技術推進無線通信。

英偉達推新AI芯片

據(jù)外媒報道，英偉達于周一宣布推出新一代人工智能芯片和用于運行人工智能模型的軟件。該公司在美國圣何塞舉行的開發(fā)者大會上宣布了這一消息，正值這家芯片制造商尋求鞏固其作為人工智能公司首選供應商的地位。

自OpenAI的ChatGPT于2022年末掀起人工智能熱潮以來，英偉達的股價上漲了五倍，總銷售額增長了兩倍多。英偉達的高端服務器GPU對于訓練和部署大型AI模型至關重要。微軟和Meta等公司已經(jīng)花費了數(shù)十億美元購買這些芯片。

圖片來源：視頻截圖

新一代AI圖形處理器命名為Blackwell。首款Blackwell芯片名為GB200，將于今年晚些時候發(fā)貨。英偉達正在用更強大的芯片吸引客戶，以刺激新訂單。例如，各公司和軟件制造商仍在爭相搶購當前一代的“Hopper”H100芯片及類似產(chǎn)品。

“Hopper很棒，但我們需要更大的GPU，”英偉達首席執(zhí)行官黃仁勛周一在該公司于加利福尼亞州舉行的開發(fā)者大會上表示。不過，周一盤后交易中，英偉達股價下跌超過1%。該公司還推出了名為NIM的創(chuàng)收軟件，該軟件將簡化AI的部署，為客戶提供了在日益增多的競爭者中堅持使用英偉達芯片的另一個理由。

英偉達高管表示，該公司正從一個唯利是圖的芯片提供商轉變?yōu)楦裎④浕蛱O果的平臺提供商，其他公司可以在此基礎上構建軟件。

“Blackwell不僅僅是一款芯片，而是一個平臺的名稱，”黃仁勛表示。

英偉達企業(yè)副總裁Manuvir Das在接受采訪時表示：“可銷售的商業(yè)產(chǎn)品是GPU，而軟件則是為了幫助人們以不同的方式使用GPU。當然，我們現(xiàn)在仍然這樣做。但真正改變的是，我們現(xiàn)在真的有了商業(yè)軟件業(yè)務。”

Das表示，英偉達的新軟件將更容易在任何英偉達GPU上運行程序，甚至是那些可能更適合部署而不是構建AI的老舊GPU。“如果你是開發(fā)者，你有一個有趣的模型，你希望人們采用它，如果你把它放入NIM中，我們會確保它可以在我們所有的GPU上運行，這樣你就可以覆蓋很多人，”Das說道。

Blackwell擁有六項革命性技術

英偉達每兩年更新一次其GPU架構，實現(xiàn)性能的飛躍。過去一年發(fā)布的許多AI模型都是在該公司的Hopper架構上訓練的，該架構被用于H100等芯片，于2022年宣布推出。

圖片來源：視頻截圖

據(jù)悉，英偉達稱，Blackwell擁有六項革命性的技術，可以支持多達10萬億參數(shù)的模型進行AI訓練和實時LLM推理：

全球最強大的芯片：Blackwell架構GPU由2080億個晶體管組成，采用量身定制的臺積電4納米工藝制造，兩個reticle極限GPU裸片將10 TB/秒的芯片到芯片鏈路連接成單個統(tǒng)一的GPU。

第二代Transformer引擎：結合了Blackwell Tensor Core技術和TensorRT-LLM和NeMo Megatron框架中的英偉達先進動態(tài)范圍管理算法，Blackwell將通過新的4位浮點AI支持雙倍的計算和模型大小推理能力。

第五代NVLink：為提高數(shù)萬億參數(shù)和混合專家AI模型的性能，最新一代英偉達NVLink為每個GPU提供了突破性的1.8TB/s雙向吞吐量，確保最復雜LLM之間多達576個GPU之間的無縫高速通信。

RAS引擎：Blackwell支持的GPU包含一個專用引擎，實現(xiàn)可靠性、可用性和服務性。此外，Blackwell架構還增加了芯片級功能，利用基于AI的預防性維護進行診斷和預測可靠性問題。這可以最大限度地延長系統(tǒng)正常運行時間，并提高大部署規(guī)模AI的彈性，使其能連續(xù)運行數(shù)周甚至數(shù)月，并降低運營成本。

安全人工智能：先進的機密計算功能可在不影響性能的情況下保護AI模型和客戶數(shù)據(jù)，并支持新的本機接口加密協(xié)議，這對于醫(yī)療保健和金融服務等隱私敏感行業(yè)至關重要。

解壓縮引擎：專用解壓縮引擎支持最新格式，加快數(shù)據(jù)庫查詢，提供數(shù)據(jù)分析和數(shù)據(jù)科學的最高性能。未來幾年，在企業(yè)每年花費數(shù)百億美元的數(shù)據(jù)處理方面，將越來越多地由GPU加速。

圖片來源：視頻截圖

Blackwell GPU體積龐大，將兩個單獨制造的晶粒組合成一個由臺積電制造的芯片。它還將作為一款名為GB200 NVLink 2的整個服務器提供，該服務器結合了72個Blackwell GPU和其他旨在訓練AI模型的英偉達部件。

亞馬遜、谷歌、微軟和甲骨文將通過云服務提供對GB200的訪問。GB200將兩個B200 Blackwell GPU與一個基于Arm的Grace CPU配對。英偉達表示，亞馬遜網(wǎng)絡服務將構建一個包含20000個GB200芯片的服務器集群。

英偉達沒有提供新款GB200或其使用系統(tǒng)的成本。據(jù)分析師估計，英偉達基于Hopper的H100芯片成本在2.5萬至4萬美元之間，而整個系統(tǒng)的成本高達20萬美元。

英偉達推理微服務

英偉達還宣布，將在其英偉達企業(yè)軟件訂閱中添加一款名為NIM（英偉達推理微服務）的新產(chǎn)品。NIM讓使用較舊的英偉達GPU進行推理（或運行AI軟件的過程）變得更加簡單，并允許公司繼續(xù)使用其已經(jīng)擁有的數(shù)億個英偉達GPU。與新AI模型的初始訓練相比，推理所需的計算能力較少。對于那些希望運行自己的AI模型，而不是從OpenAI等公司購買AI結果作為服務的企業(yè)來說，NIM無疑是他們的得力助手。

英偉達的策略是吸引購買基于英偉達的服務器的客戶注冊英偉達企業(yè)版，每個GPU每年的許可費為4500美元。

英偉達將與微軟或Hugging Face等AI公司合作，確保他們的AI模型能夠在所有兼容的英偉達芯片上運行。隨后，開發(fā)者可以使用NIM在自有服務器或基于云端的英偉達服務器上高效運行模型，無需繁瑣的配置過程。

“在我原本調(diào)用OpenAI的代碼中，我只需替換一行代碼，將其指向從英偉達獲取的NIM即可。”Das說道。

英偉達表示，該軟件還將助力AI在配備GPU的筆記本電腦上運行，而非僅限于云端服務器。

每日經(jīng)濟新聞綜合第一財經(jīng)、公開消息

免責聲明：本文內(nèi)容與數(shù)據(jù)僅供參考，不構成投資建議，使用前請核實。據(jù)此操作，風險自擔。

封面圖片來源：視頻截圖

如需轉載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

英偉達 Ai AI芯片 GPU

上一篇文章