每日經濟新聞 2023-06-07 18:21:02
◎阿里巴巴集團董事局主席、首席執行官張勇表示,阿里云要全面走向“模型即服務”。一方面,阿里云希望大模型技術的應用打開更大的使用入口;另一方面,阿里云在4月底率先宣布公有云大降價后,引發了公有云市場多家云服務廠商的價格調整。
◎技術迭代、價格下降,能否釋放新的增量空間、形成正向循環,有待新一季財報驗證。而對諸多云計算廠商而言,大模型應用帶來了云計算市場的“iPhone時刻”,新格局正在開啟。
每經記者 葉曉丹 每經編輯 董興生
6月1日,阿里云對外披露了通義大模型進展,推出聚焦音視頻的AI產品“通義聽悟”,該產品成為國內首個開放公測的大模型應用產品。
阿里云方面透露,通義聽悟接入了通義千問大模型的理解與摘要能力,能實現隨時隨地高效完成對音視頻內容的轉寫、檢索、摘要和整理,可成為用戶工作學習中的得力AI助手。
此前的5月6日,科大訊飛正式對外發布“訊飛星火認知大模型”。據悉,6月9日,科大訊飛還將發布這一大模型的新進展,包括開放式問答取得突破,多輪對話和數學能力再升級,文本生成、語言理解、邏輯推理能力持續提升等。
阿里云智能CTO周靖人在接受包括《每日經濟新聞》記者在內的媒體采訪時透露,通義聽悟結合了之前阿里云研發的語音能力,下一階段會陸續推出增強版并進行商業化安排。
阿里云智能CTO周靖人(左) 圖片來源:每經記者 葉曉丹 攝
今年4月26日,阿里云提出要走向“產品被集成”,形成“1+3+1”的產品被集成結構:頂層為MaaS模型即服務,阿里云向生態開放大模型能力和訓練底座。值得注意的是,阿里云此次發布的通義千悟既可以作為SaaS應用層,又可以被集成為MaaS層。
可以說,阿里云將大模型提到了一個新的高度。阿里巴巴集團董事局主席、首席執行官張勇表示,阿里云要全面走向“模型即服務”。一方面,阿里云希望大模型技術的應用打開更大的使用入口;另一方面,阿里云在4月底率先宣布公有云大降價后,引發了公有云市場多家云服務廠商的價格調整。
技術迭代、價格下降,能否釋放新的增量空間、形成正向循環,有待新一季財報驗證。而對諸多云計算廠商而言,大模型應用帶來了云計算市場的“iPhone時刻”,新格局正在開啟。
繼4月26日阿里云宣布公有云價格大幅下調以來,騰訊云、移動云、京東云等頭部云廠商也先后降價。
5月16日,騰訊云宣布對多款核心云產品實施降價,部分產品線最高降幅達40%;5月23日,京東云稱,全系核心產品的官網列表價均低于特定云廠商官網對標的產品列表價格,實際成交單價將在特定云廠商實際成交最低單價的基礎上再打九折,“買貴就賠”。
值得注意的是,公有云價格戰對私有云市場也有所攪動。5月初,一家IT服務商上市公司就告訴記者,公有云市場的價格戰,也會進一步引起私有云市場的價格向下。
圖片來源:每經記者 葉曉丹 攝
近日,一家頭部云服務廠商的第三方服務商在和《每日經濟新聞》記者交流時亦透露,公有云價格下降,必然給私有云帶來一定的波動性。“但這和公司規模、行業有關,像大型央企國企、金融行業更看重安全保密性,選擇私有化比較多,而普通公司則會根據價格和需求來選擇。”
數瀾科技董事長甘云峰在5月底的“數棲大會”上接受記者專訪時表示,公有云市場的大降價對私有云的建設成本有影響,不過,由于私有云價格成本相對固定,所以私有云的價格波動空間不會非常大。
而對于公有云市場價格戰,甘云峰表示,這對于下游的數據應用服務商而言,可以有更好的促進作用。“過去客戶數字化的服務,在硬件上的投入往往占據大部分經費,而隨著公有云市場價格的下降,客戶可以將更多的費用投入到業務策略、應用層面,也更有助于行業的發展,尤其有助于數據應用領域的發展,可以讓終端客戶將更多的資金投入到業務場景,在產業數據上挖掘更多的價值。”
作為數據應用基礎設施供應商,數瀾科技搭建了一站式數據中臺基礎設施“數棲平臺”,提供數據中臺解決方案、數據可視化服務、數據智能解決方案等產品矩陣。不過,甘云峰也提及,客戶對云計算廠商的選擇,一般不會根據價格高低進行調整,而是首先基于客戶選擇匹配的服務器。但基于成本考慮,會推薦更具性價比的服務器,讓客戶能夠有更多資金投入到真正的業務場景中。
而大模型技術為云計算市場帶來了新的變化。招商證券研報分析認為,整體而言,大模型的定位從簡單的技術賦能轉向平臺生態入口卡位,同時ChatGPT Plugins的出現將加速“AI+”時代生態的明晰和應用層的繁榮,兩者協同將為現代人類的生活帶來全維度的顛覆性變化。
周靖人透露,在各種企業與行業之間仍有不少基于大模型的新需求,阿里云還在繼續探索,接下來會發布一系列新產品。對提出“模型即應用”的阿里云而言,在公有云價格下降的同時,通過大模型打造新的生態入口,做大規模效應的成效如何,仍有待市場校驗。
不過,從目前來看,大模型技術距離走向整個生態的繁榮還有一段路程。
而對以大模型為代表的AGI產業結構,此前的2023阿里云峰會上,招商局創投汪婧在演講中表示,整體結構共分為四層,分別是計算層、模型層、中間層和應用層。其中,如當前算力以及訓練成本會以多快的速度、下降多少,會影響到整個產業鏈。
招商局創投汪婧 圖片來源:每經記者 葉曉丹 攝
AI大模型催生了巨大的算力需求,當前,A100是大模型應用的“主力芯片”。據媒體報道,在眼下的AI時代,“算力即權力”似乎已成為行業主旋律,算力設施需求量仍在持續攀升。OpenAI指出,AI大模型要持續取得突破,所需消耗的計算資源每3~4個月就要翻一倍,資金也需要通過指數級增長獲得匹配。
A100的價格大約為1萬美元,是目前AI應用的“主力芯片”。另據了解,此前一些零售商對另一款芯片H100的報價大約在3.6萬美元,近期價格又有了顯著上漲。
英偉達的研究表明,GPT3最大規模的模型需要使用175 Billions的參數量,需要使用512顆V100顯卡訓練7個月時間,或者使用1024顆A100芯片訓練一個月時間。大模型訓練每月成本在數百萬美元以上量級。
大模型的開發成本高昂,也成為國內外巨頭一場昂貴的嘗試。
圖片來源:視覺中國-VCG41N1462568496
在業內人士看來,公共云是AI新型基礎設施的最佳載體。頭部云廠商已經搭建好超大規模、高性能、低成本的算力公共設施,不需要“重復造輪子”。
汪婧表示,在重資本和人才投入的基礎通用模型層,國內大廠會是通用大模型的重要參與者。與此同時,極少數創業公司以其人才技術積累,以及創新和靈活性,有機會在國內做出好用的通用大模型。
在應用層及中間件領域,汪婧表示,當前許多領域在國內尚未發展,隨著后續國內基礎模型的能力提升和產業成本下行,預計未來會百花齊放。
每日互動董事長方毅在接受《每日經濟新聞》記者專訪時透露,大模型算法慢慢會走向開源,估計在未來三年內會迎來“安卓時代”,就是開源的大模型或達到相當水平的時代,會有更好的、更繁茂的生態發展。
周靖人在回應開源問題時表示:“我們其實非常支持開源,通過開源一系列的模型,能夠讓大家降低學習的成本,去嘗試自己的一些突破。每個企業有具體的核心業務環境,就需要更加精細化選擇,到底是用什么樣的模型。”
5月30日,中國信息通信研究院聯合產業各方共同編制“紙鳶”開放人工智能模型許可證,旨在為共同打造具有變革意義的大模型開源項目奠定堅實基礎。
中國信通院云大所開源和軟件安全部主任郭雪表示,AI大模型的本質決定了開源是其必經之路。編制“紙鳶”開放人工智能模型許可證,正式為了充分發揮大型模型的通用性優勢,促進大型模型技術在產業中真正落地。下一步,將發布《紙鳶開放人工智能模型許可證(征求意見稿)》。
每日互動(300766.SZ,股價18.63元,市值74.54億元)董事長方毅認為,大模型計算需要大數據訓練,所以優質的數據非常重要。算法、算力很重要,而數據這個“算料”可能會更重要,“算料”將成為非常重要的一個引擎。
數瀾科技董事長甘云峰則提出,大模型技術給大數據行業帶來了兩方面的主要影響。一是基礎能力建設,可以通過大模型技術完成,極大地提升效率。另一方面,當前存在數據急劇增長和算力增長之間的矛盾,技術的進步已經跟不上數據的增速,大模型技術的應用對GPU要求非常高。
高昂的算力成本既然無解,當硬件發展跟不上軟件發展速度時,能否從數據入手,通過挖掘數據自身的組織能力來彌補算力短板?甘云峰認為,這是很有可能的,AI的土壤是數據。
數瀾科技董事長甘云峰 圖片來源:受訪者供圖
在大模型“百花齊放”的背景下,民生證券在研報中指出,“單純發布一個大模型的門檻沒有市場想象中的那么高”,“有大模型不難,難的是有一個能持續迭代,性能不斷提升的優質大模型”。也有觀點提出,高質量數據才是大模型發展的稀缺要素。
數據要素也成為資本市場備受關注的細分領域。6月6日,數據要素概念股震蕩反彈,金橋信息(603918.SH,股價34.08元,市值125.33億元)、中國科傳(601858.SH,股價48.14元,市值380.55億元)漲停;開普云(688228.SH,股價61.84元,市值41.52億元)、中遠??疲?02401.SZ,股價28.11元,市值104.54億元)、美亞柏科(300188.SZ,股價25.18元,市值216.42億元)等跟漲。
近期,多家券商的最新研報也對數據要素進行了密集覆蓋。
德邦證券介紹,數字經濟的上游基礎層在于數據價值化,上游包括數據要素、信創、數字基建三個細分,其中數據要素又是整個數字經濟產業鏈循環的基礎。
天風證券分析認為,算法、算力、數據是AI核心三要素,當前AI大模型的訓練,算法端向神經網絡Transformer模型收斂,算力端依賴具備大規模并行計算能力的AI服務器集群,數據端則需要巨大數據量的大規模數據集投喂。AI三要素中數據是直接影響AI大模型在垂直行業落地效果的關鍵,而垂類數據通常由政府和行業機構掌握,相比于模型和算力,數據稀缺性明顯。
目前,通用大模型的訓練數據集多來自互聯網文本數據,例如ChatGPT訓練數據集來自維基百科、互聯網新聞、社交媒體、電子書等。彭博社發布了針對金融領域的大型語言模型BloombergGPT,訓練采用51.27%金融信息數據和48.73%的公共數據,在500億參數規模下,BloombergGPT對金融任務效果好于通用大模型。
那么,未來針對“算料”的博弈是否會更加白熱化?
方毅認為,數據要素市場最終會形成某種程度上的開放合作。第一級的核心數據開發商可能以央企、國企為主,第二級開發商可能會有更多民營企業和市場化力量參與進來
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP