每日經濟新聞 2023-04-17 22:43:31
每經記者 朱成祥 每經編輯 楊夏
ChatGPT的火熱,讓國內不少互聯網、AI企業紛紛加碼大模型。比如云從科技(SH688327,股價42.60元,市值315.5億元)近期就擬募集36億元投向“大模型”。
曾經的AI,是CV(計算機視覺)的天下。就國內而言,最受矚目的AI公司當屬“CV四小龍”商湯科技(HK00020,股價2.81港元,市值940.5億港元)、曠視科技、云從科技和依圖科技。ChatGPT的橫空出世,令AI產業的焦點迅速從視覺轉為語言,從CV轉為NLP(自然語言處理)。
數據來源:IDC、中商產業研究院整理視覺中國圖劉紅梅制圖
在語言大模型時代,CV“四小龍”之一的云從科技又將何去何從?特別是大模型追求“強者恒強”,可能將是少數巨頭的游戲。在算力“軍備競賽”中,云從科技能否跟上巨頭的腳步?
值得注意的是,云從科技已被列入實體清單。這意味著公司采購海外廠商生產的高端AI芯片存在限制,比如目前最火熱的AI芯片當屬英偉達A100和H100。對此,《每日經濟新聞》記者4月13日致電云從科技。其工作人員表示,(上述芯片)此前有一點庫存,公司也在與國內廠商合作。
4月17日,云從科技股價報收42.60元/股,漲幅為1.55%。
少數玩家的游戲
互聯網、移動互聯網的興盛,使得各行各業崛起了一大批細分領域的巨頭。AI的興起,同樣在各細分領域百花齊放。比如CV(計算機視覺)領域的“四小龍”;語音領域的科大訊飛(SZ002230,股價58.23元,市值1353億元)、思必馳。
而大模型時代,游戲規則驟然改變。算力的“軍備競賽”,導致大模型成本高企,可能僅有少數巨頭能夠負擔。
據國盛證券計算機團隊測算,以英偉達A100芯片、DGX A100服務器、現階段每日2500萬訪問量等假設為基礎,估算得出:在初始算力投入上,為滿足ChatGPT當前千萬級用戶的咨詢量,投入成本約為8億美元,對應約4000臺服務器;在單日運行電費上,參考美國平均0.08美元/kwh工業電價,每日電費約為5萬美元,成本相對高昂。
此次云從科技欲募集資金36.35億元,用于云從“行業精靈”大模型研發項目。其中,場地購置及裝修費5.54億元,研發設備購置費20.94億元,人力資源成本7.60億元,其他費用2.27元。
算力投入應屬于研發設備購置費。照此計算,云從科技欲投入不超過20.94億元用于算力投入。
截至2022年三季度末,云從科技貨幣資金12.47億元。2022年第三季度,上市公司營收6479.03萬元,同比下降80.07%;歸母凈利潤-2.64億元。2022年前三季度,上市公司營收4.55億元,同比下降41.53%;歸母凈利潤-5.89億元,經營性現金流凈額-5.29億元。
從云從科技財務數據看,初始投入之后的訓練費用、運行電費對其也是較沉重的負擔。據國盛證券計算機團隊,基于參數數量和token數量估算,GPT-3訓練一次的成本約為140萬美元;對于一些更大的LLM模型(如擁有2800億參數的Gopher和擁有5400億參數的PaLM),采用同樣的計算公式,可得出,訓練成本介于200萬美元至1200萬美元之間。
據天風計算機團隊,參考GPT-3的發展歷程,OpenAI從45TB的文件中過濾出570GB的數據集,僅訓練費用就高達1200萬美金,隨后OpenAI經過約3年時間不斷探索,中途有InstructGPT、davinci不同版本的嘗試,最終在2023年發布了GPT-4,打造一個有競爭力的大模型需要數據、算法等資源的持續投入。
行業“強者恒強”
那么,云從科技是否可以與巨頭進行差異化競爭,做一個“小而美”的垂直行業領軍者?
在信達證券看來,參數量超級龐大的模型在任何垂直領域都具備優勢,垂直細分的小模型難有生產空間。因此,信達證券認為在大模型格局未完全形成之前,參數量的無上限堆砌是各家企業發力的焦點,故算力的“軍備競賽”無可避免。
據天風計算機團隊統計,百度Ernie大模型參數量約為2600億,京東言犀、商湯商量SenseChat參數量為千億級別,騰訊混元AI大模型參數量為萬億級別。華為盤古α參數量為2000億。
據云從科技公告,2020年,OpenAI發布的NLP大模型GPT-3,實現了千億級數據參數,大模型也成為了超大規模預訓練模型的代名詞。2022年,ChatGPT的出現更進一步確定了大模型作為人工智能主流技術路線的趨勢。
可以看出,各大巨頭的參數級別為千億級乃至萬億級。
為何各家都在比拼參數量?信達證券認為,從論文研究來看,參數量的提升有助于構建語言預測模型的精確度,同時提高泛化能力。泛化能力的提升意味著一個參數量超級龐大的大模型,其在垂直細分領域的預測能力可超過針對垂直領域開發的中等參數量模型。
這意味著,做大模型似乎只有成為巨頭,才能避免被邊緣化。
天風計算機團隊也認為,擁有一個大模型并不難,但是持續打造一個有競爭力的大模型難度很大。雖然國內有眾多廠商推出了大模型,但從終局的角度看,大模型終將收斂并稀缺。參考OpenAI在海外的發展歷程,大模型需要連同生態一起進化,形成強者恒強的格局。
芯片從何而來?
中航證券研究所認為,在ScalingLaw的框架下,只要追加數據與算力,大模型的能力就能持續增強。對OpenAI而言,目前大模型的最大限制是數據和算力的總量。
或許,大模型之間的競爭,已經轉為對數據與算力資源的爭奪。
對于云從科技而言,由于公司被納入美國“實體清單”,購買模型訓練用的高端芯片面臨限制。即使資金充足,能否成功獲取龐大算力所需芯片呢?
云從科技定增預案顯示,2020年5月至今,美國商務部宣布將包括公司在內的多家中國公司及機構列入“實體清單”,該行為不會對公司日常對外銷售、客戶拓展等產生重大不利影響,但可能對公司研發和項目交付過程中采購境外廠商的芯片、服務器等器件產生一定限制,盡管公司已制定國產器件替代的產品方案,但由于方案落地需要一定驗證時間、客戶對使用替代器件的產品認可具有不確定性等因素,可能會對公司的生產經營產生一定影響。
簡而言之,對銷售影響不大,影響主要是采購境外廠商芯片、服務器。
對于芯片問題,《每日經濟新聞》記者4月13日致電云從科技,其工作人員表示:“首先有一部分庫存,然后我們和國產芯片供應商之前也完成深度適配。”
該工作人員也表示,具體芯片問題公司在2月份投資者活動記錄表有回復。記者查詢后了解到,云從科技芯片的采購分兩類。第一類:公司過去向英偉達采購部分芯片用以訓練側方面,公司具有一定量的庫存儲備且國產化的訓練芯片水平也已經在快速提升中。第二類:過去兩年中,公司在國產化硬件適配方面穩扎穩打,已與華為、寒武紀(SH688256,股價196.80元,市值816億元)、曙光等提供芯片和服務器的廠商完成了深度適配。
值得一提的是,云從科技一度研發過AI芯片,如承擔工信部“基于自研SoC芯片的高準確度人臉識別產業化應用”等國家級重大項目建設任務。
而根據云從科技招股書,其表示公司所處的人工智能行業尚處于發展初期,未來發展趨勢存在較大不確定性,相關技術及各應用場景的定制化解決方案迭代速度快,技術的產品化和市場化亦具有一定的不確定性。2020年,由于芯片設計成果未達預期,且EDA軟件和生產流片遭遇限制,公司終止了“人工智能SOC芯片研制及結合高準確度人臉識別技術的產業化應用”項目。
也就是說,云從科技終止了自研人工智能SOC芯片。
封面圖片來源:數據來源:IDC、中商產業研究院整理視覺中國圖劉紅梅制圖
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP