要聞

DeepSeek“卡爆了”如何解決？多家國產(chǎn)算力廠商已適配，主要面向推理

每日經(jīng)濟(jì)新聞 2025-02-05 22:16:46

龐大的訪問量令DeepSeek用戶在使用其“深度思考”和“聯(lián)網(wǎng)搜索”時常遭遇“服務(wù)器繁忙”。不過好消息是，目前已有多家國產(chǎn)AI算力廠商宣布適配DeepSeek，比如華為昇騰、壁仞科技、天數(shù)智芯、摩爾線程、沐曦等。

每經(jīng)記者朱成祥每經(jīng)編輯楊夏

近期，資本市場最熱的話題當(dāng)屬DeepSeek（深度求索）。從美國硅谷到中國街頭巷尾，人們紛紛討論著DeepSeek對AI大模型行業(yè)帶來的巨大影響。

DeepSeek話題的火熱，也帶動其官方網(wǎng)頁和App訪問量的上升。新用戶的大量涌入令DeepSeek用戶在使用其“深度思考”和“聯(lián)網(wǎng)搜索”功能時常常遭遇“服務(wù)器繁忙”。不過好消息是，目前已有多家國產(chǎn)AI（人工智能）算力廠商宣布適配DeepSeek，比如華為昇騰、壁仞科技、天數(shù)智芯、摩爾線程、沐曦等。在不久的將來，流暢地使用DeepSeek的各種功能或許并不是一件難事。

壁仞科技工作人員對《每日經(jīng)濟(jì)新聞》記者表示：“DeepSeek有結(jié)構(gòu)上的微創(chuàng)新，但是還是LLM（大語言模型），所以推理適配起來并不難。”

DeepSeek火熱帶來龐大推理算力需求

根據(jù)中信建投研報，DeepSeek的網(wǎng)頁端訪問量，從2024年10月至2024年12月，分別為245萬、422萬和1101萬。DeepSeek于2025年1月10日上線官方App，自該App發(fā)布以來，第18天已達(dá)到1500萬日活。

2月4日，天數(shù)智芯官方微信號披露，在AI技術(shù)蓬勃發(fā)展的當(dāng)下，芯片技術(shù)成為關(guān)鍵。DeepSeek R1的橫空出世宛如一道閃電，強(qiáng)勢沖破長期以來的技術(shù)壁壘，為中國AI行業(yè)注入全新活力。今日（2月4日），天數(shù)智芯與Gitee AI聯(lián)合發(fā)布消息，在雙方的高效協(xié)作下，僅用時一天，便成功完成了與DeepSeek R1的適配工作，并且已正式上線多款大模型服務(wù)，其中包括DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-14B等。

天數(shù)智芯副總裁宋煜2月5日對《每日經(jīng)濟(jì)新聞》記者表示：“天數(shù)智芯的產(chǎn)品是通用GPU，在芯片設(shè)計的技術(shù)路線上和國際主流路線相近，在軟件生態(tài)層面，天數(shù)的IXUCA軟件棧兼容國際主流生態(tài)，所以適配DeepSeek的V2、V3、R1、Janus等模型版本非常順利。”

據(jù)其介紹：“目前天數(shù)已經(jīng)完成了V3、R1、Janus等模型的推理適配工作，在公開數(shù)據(jù)的精度測試上也和論文相當(dāng)。適配成功后，天數(shù)也和Gitee AI、并行計算、算力互聯(lián)等合作伙伴一起上線了多款大模型服務(wù)。”

無獨(dú)有偶，華為計算于2月4日表示，潞晨科技攜手昇騰，聯(lián)合發(fā)布基于昇騰算力的DeepSeek R1系列推理API及云鏡像服務(wù)。2月5日，華為官方微信號披露，2025年2月4日，DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上線昇騰社區(qū)，支持一鍵獲取DeepSeek系列模型，支持昇騰硬件平臺上開箱即用，推理快速部署，帶來更快、更高效、更便捷的AI開發(fā)和應(yīng)用體驗(yàn)。

摩爾線程也于2月4日表示，作為國產(chǎn)全功能GPU創(chuàng)新企業(yè)，摩爾線程快速實(shí)現(xiàn)對DeepSeek蒸餾模型推理服務(wù)的高效部署，旨在賦能更多開發(fā)者基于摩爾線程全功能GPU（圖形處理器）進(jìn)行AI應(yīng)用創(chuàng)新。

各家算力主要面向推理

可以看出，無論華為昇騰、天數(shù)智芯還是摩爾線程，均針對DeepSeek推理服務(wù)進(jìn)行適配。

隨著DeepSeek帶來大模型訪問量的暴增，推理芯片或?qū)⒈l(fā)。浙商證券認(rèn)為，DeepSeek訓(xùn)練和推理成本大幅降低將帶來大模型和用戶側(cè)準(zhǔn)入門檻的同步降低，不僅帶來同等預(yù)算下模型側(cè)的迭代加速，“低成本+高性能”的模型也會加速推動企業(yè)和個人用戶對AI Agent（人工智能智能體）、AI應(yīng)用等的使用，從而推動AI商業(yè)化落地進(jìn)程的顯著提速，在此背景下，推理環(huán)節(jié)的算力需求將得到激發(fā)。

而算力廠商壁仞科技、云服務(wù)廠商優(yōu)刻得也強(qiáng)調(diào)推理效率的重要性。壁仞科技認(rèn)為，推理效率已成為目前行業(yè)各公司發(fā)展的核心競爭力。憑借壁仞科技自主研發(fā)的壁礪TM系列產(chǎn)品出色的兼容性能，僅用數(shù)小時即完成對DeepSeek-R1全系列蒸餾模型的支持，涵蓋了從1.5B到70B各等級參數(shù)版本，包括LLaMA蒸餾模型和千問蒸餾模型。為開發(fā)者提供高性能、低成本的大模型部署與開發(fā)解決方案。

關(guān)于國產(chǎn)算力芯片適配DeepSeek的重要性，天數(shù)智芯副總裁宋煜表示：“目前，大模型生態(tài)上，訓(xùn)練部分主要依賴CUDA+NVIDIA GPU，國產(chǎn)GPU的適配仍需突破。與DeepSeek合作，能加速國產(chǎn)GPU芯片的深度學(xué)習(xí)框架優(yōu)化、算子優(yōu)化、分布式訓(xùn)練適配，降低國產(chǎn)AI企業(yè)的遷移成本，打造‘國產(chǎn)算力+國產(chǎn)大模型’的閉環(huán)生態(tài)。”

宋煜認(rèn)為：“DeepSeek等國產(chǎn)大模型廠商的成功，離不開強(qiáng)大的算力支持。我們的目標(biāo)是提供穩(wěn)定、可擴(kuò)展、性價比高的GPU解決方案，推動國產(chǎn)大模型更快迭代、更高效部署。未來，我們可以進(jìn)一步深化合作，包括聯(lián)合優(yōu)化AI訓(xùn)練框架、開發(fā)定制化AI加速方案，更高效的分布式推理引擎等。”

封面圖片來源：視覺中國-VCG21a06e33023

如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。