每日經濟新聞 2024-03-27 19:02:39
每經編輯 蒙錦濤
3月26日,商湯科技發布了2023年度財務報告,展現出其在生成式AI領域的強勁增長勢頭。
2023年,商湯實現營收34億元,毛利潤為15億元,毛利率44%。其中,“日日新”大模型+大裝置驅動生成式AI業務爆發式增長200%,收入已達12億元,為集團貢獻35%的營收。
得益于“大裝置+大模型”戰略的前瞻性布局,商湯科技不僅在AI基礎設施建設上取得了顯著成就,更在生成式AI業務上實現了突破性進展。2023年的成績單,展示出其在生成式AI領域的強大實力和廣闊前景。隨著AI技術的不斷進步和應用場景的日益拓展,商湯科技將繼續聚焦生成式AI核心業務,推動公司的持續高速增長。商湯科技的成功,不僅為行業樹立了標桿,也為AI 2.0時代的來臨奠定了堅實的基礎。
生成式AI業務成增長新引擎
年報顯示,2023年,商湯生成式AI業務收入達12億元,這是商湯成立十年以來,以最快速度從無到有、超過10億元收入體量的新業務。
此外,大裝置的總算力規模實現突破性增長達12000petaFLOPS,運營GPU數量達45000卡,由此支持“日日新”大模型體系高速迭代至4.0版本,在多個場景中達到與GPT-4相匹配的能力水平。
商湯科技董事長兼CEO徐立博士表示:“生成式AI對商湯來說已不僅僅是技術領域的變革性創新,更成為公司的核心業務。商湯生成式AI業務的增長,得益于各行各業對大模型的訓練和推理的廣泛需求,這預示著中國硬科技投資的新周期正式開啟。商湯通過在各業務層面深入融合生成式AI能力,正在贏得新客戶,并推動效率和生產力的全面提升。”
回顧2023年,商湯“日日新”大模型系列不斷經歷重要的技術升級,每一次升級都穩居行業前沿,顯示了商湯深厚的技術底蘊。到2024年2月,商湯推出“日日新4.0”,在不增加參數量的基礎上,通過提高訓練數據質量,實現了大模型性能的顯著提升。在代碼編寫、數據分析和醫療問答等多個場景中,達到了與GPT-4相匹配的能力水平。
在堅實的技術基座支撐下,商湯的“日日新”大模型已在多個行業中確立了應用價值,廣泛應用于金融、醫療、智能終端等多個領域。
大模型浪潮繼續,生成式AI正逐漸成為各行各業的新寵,而商湯科技憑借其在大語言模型(LLMs)領域的深厚積累,成功將這一前沿技術轉化為實際的商業應用,從而在激烈的市場競爭中占據先機。
2023年,商湯集團明確了新的三大業務板塊:生成式AI、傳統AI和智能汽車;以生成式AI業務為重點發展方向,同時保持傳統AI業務和智能汽車的優勢。商湯的這一調整背后,不僅標志著其在技術領域的變革性創新,更展現了公司在AI商業化道路上的堅定步伐。
“大裝置+大模型”
構筑AI核心競爭力
競逐人工智能,技術是最大的底氣。在生成式人工智能迅速為商湯帶來顯著收入背后,實則是商湯在技術層面數次超前布局帶來的收獲。
在新一輪人工智能潮起前,商湯憑借其前瞻式布局,早早搭建起“大裝置+大模型”協同戰略,率先完成“模型即服務”。
商湯是較早投入人工智能基礎設施的公司,自2018年起便開始大力投入人工智能基礎設施建設,特別是在SenseCore大裝置上的持續投資,為公司在AI領域的長遠發展奠定了堅實的基礎。此外,商湯科技此前頂住虧損壓力大力建設的臨港AIDC,作為亞洲規模領先的AI計算中心,如今不僅提供了強大的算力支持,也為大模型的研發和迭代提供了有力保障。
商湯也是國內較早研發大模型,且是較早發布大模型系列產品的廠商。其預訓練基模型InternLM-104B(1040億參數)在35個評測集上性能超越OpenAI的GPT-3.5-turbo。
基于“大裝置+大模型”的協同,在過去一年的“百模大戰”中,商湯已成為少有的能夠保持大模型高速迭代的公司。
基于業界性能領先的AI基礎設施和模型服務,商湯的客戶模型訓練、微調和推理等業務都在爆發式增長。該業務中超過70%的客戶在過去12個月內是商湯的新客戶,而剩下的30%的存量客戶客單價也錄得了約50%的增長。典型客戶來自各行各業,比如三大運營商,招商銀行、海通證券等金融機構,京東、小米、閱文等頭部互聯網公司,清華大學、上海交通大學等學術機構。
此外,在大模型時代,商湯的前瞻性布局還在繼續。此前,商湯率先推出“模型即服務”商業模式,重點關注軟件調用能力,使客戶能夠輕松地進行大裝置微調和調用各類生成式AI能力,而無需管理底層基礎設施。
在弗若斯特沙利文發布的《2023年中國AI開發平臺市場報告》中,商湯在增長指數和創新指數兩大評估維度的綜合評分中位居國內首位。這一成績不僅展示了商湯在生成式AI領域的領先地位,也表達了對其創新能力和市場擴張速度的認可。
技術創新
推動業務持續增長
商湯也在年報中提到,目前的生成式AI模型能力遠未達到上限,“日日新”大模型的能力每隔三個月就會顯著提升,從而在企業中的應用也會隨之升級。
目前,商湯正致力于“日日新5.0”版本的研發,該版本計劃4月份發布,將全面達到GPT-4-turbo的標準,同時支持百萬字無損上下文,并且它的多模態模型能力也將全面對標GPT4V。
商湯“日日新”大模型的持續迭代和優化,不僅反映了公司在人工智能領域的技術追求與創新,也持續體現了其將前沿科技轉化為實際應用價值上的決心和能力。
舉例而言,在金融行業中,商湯通過精進模型的檢索增強生成(RAG)技術,顯著提升了模型的數據處理和問題回答能力。利用RAG技術,金融數據被高效地映射到矢量數據庫中,強化了模型的金融知識儲備,有效降低了錯誤信息生成(俗稱“幻覺”現象)的發生率。這一突破使得模型能夠精準回應專業的金融查詢,因此,包括中國銀行、招商銀行、中國工商銀行和上海銀行等在內的諸多知名銀行已紛紛采用“日日新”大模型,以構建其“數字員工”和“數字客服”系統,以期提供更加智能化的客戶服務體驗。
在智能終端領域,商湯也提到,2024年是端側大模型應用的爆發之年。商湯基于在智能終端的多年積累,構建了行業領先的、不同規格的小模型。例如,同樣是7B模型,商湯的性能領先于Meta的Llama2和谷歌的Gemma。2023年,高通、MTK在發布會上展示了商湯子公司慧鯉生成式AI端側模型在其旗艦芯片上的應用成果;商湯的7B級小型模型在高通最新款芯片上,實現了業界領先的16tokens/秒的推理速度。
這些智能終端模型對于AI手機來說至關重要,它們能夠聽取用戶的指令,并調用手機上的各類應用程序完成復雜任務。商湯已與小米、榮耀等手機品牌合作,共同研發這些創新的功能特性。
2024年,“技術領先”依舊是商湯的關鍵詞。
商湯方面也表示,將進一步發揮“大裝置+大模型”的深度協同優勢,持續擴充算力規模、提升基礎設施和大模型的綜合服務能力。將持續投入“日日新”大模型體系的迭代,讓模型能力保持業界領先。同時,還將致力于實現大模型推理效率提升的“摩爾定律”,通過云+端結合等創新優化策略,讓模型推理成本迅速降低,從而打開更廣闊的應用前景。
基于技術領先優勢,商湯的業務增長提速也有望提上日程。商湯方面表示,將加快生成式AI的商業化進程和市場滲透,為用戶提供具有最優性價比的生成式AI解決方案。
商湯在年報中表示,“在我們邁向通用人工智能(AGI)的征途上,尺度定律(Scaling Law)扮演著至關重要的角色。我們所見證的大裝置和大模型在過去一年所取得的突破性進展,僅僅標志著這一旅程的開始。當前生成式AI模型的能力尚未觸及其潛能的頂峰,我們預期這些模型的能力將持續增強,并在企業中實現更高級別的應用。”
(本文不構成任何投資建議,信息披露內容以公司公告為準。投資者據此操作,風險自擔。)
編輯|蒙錦濤
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP