• <acronym id="mz9d1"><output id="mz9d1"></output></acronym>

    <sub id="mz9d1"><ol id="mz9d1"><nobr id="mz9d1"></nobr></ol></sub>
        1. <sup id="mz9d1"></sup>
          每日經濟新聞
          要聞

          每經網首頁 > 要聞 > 正文

          DeepSeek“卡爆了”如何解決?多家國產算力廠商已適配,主要面向推理

          每日經濟新聞 2025-02-05 22:16:46

          龐大的訪問量令DeepSeek用戶在使用其“深度思考”和“聯(lián)網搜索”時常遭遇“服務器繁忙”。不過好消息是,目前已有多家國產AI算力廠商宣布適配DeepSeek,比如華為昇騰、壁仞科技、天數智芯、摩爾線程、沐曦等。

          每經記者 朱成祥    每經編輯 楊夏    

          近期,資本市場最熱的話題當屬DeepSeek(深度求索)。從美國硅谷到中國街頭巷尾,人們紛紛討論著DeepSeek對AI大模型行業(yè)帶來的巨大影響。

          DeepSeek話題的火熱,也帶動其官方網頁和App訪問量的上升。新用戶的大量涌入令DeepSeek用戶在使用其“深度思考”和“聯(lián)網搜索”功能時常常遭遇“服務器繁忙”。不過好消息是,目前已有多家國產AI算力廠商宣布適配DeepSeek,比如華為昇騰、壁仞科技、天數智芯、摩爾線程、沐曦等。在不久的將來,流暢地使用DeepSeek的各種功能或許并不是一件難事。

          壁仞科技工作人員對《每日經濟新聞》記者表示:“DeepSeek有結構上的微創(chuàng)新,但是還是LLM(大語言模型),所以推理適配起來并不難。”

          DeepSeek火熱帶來龐大推理算力需求

          根據中信建投研報,DeepSeek的網頁端訪問量,從2024年10月至2024年12月,分別為245萬、422萬和1101萬。DeepSeek于2025年1月10日上線官方App,自該App發(fā)布以來,第18天已達到1500萬日活。

          2月4日,天數智芯官方微信號披露,在AI技術蓬勃發(fā)展的當下,芯片技術成為關鍵。DeepSeek R1的橫空出世宛如一道閃電,強勢沖破長期以來的技術壁壘,為中國AI行業(yè)注入全新活力。今日(2月4日),天數智芯與Gitee AI聯(lián)合發(fā)布消息,在雙方的高效協(xié)作下,僅用時一天,便成功完成了與DeepSeek R1的適配工作,并且已正式上線多款大模型服務,其中包括DeepSeek R1-Distill-Qwen-1.5B、DeepSeek R1-Distill-Qwen-7B、DeepSeek R1-Distill-Qwen-14B等。

          天數智芯副總裁宋煜2月5日對《每日經濟新聞》記者表示:“天數智芯的產品是通用GPU,在芯片設計的技術路線上和國際主流路線相近,在軟件生態(tài)層面,天數的IXUCA軟件棧兼容國際主流生態(tài),所以適配DeepSeek的V2、V3、R1、Janus等模型版本非常順利。”

          據其介紹:“目前天數已經完成了V3、R1、Janus等模型的推理適配工作,在公開數據的精度測試上也和論文相當。適配成功后,天數也和Gitee AI、并行計算、算力互聯(lián)等合作伙伴一起上線了多款大模型服務。”

          無獨有偶,華為計算于2月4日表示,潞晨科技攜手昇騰,聯(lián)合發(fā)布基于昇騰算力的DeepSeek R1系列推理API及云鏡像服務。2月5日,華為官方微信號披露,2025年2月4日,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上線昇騰社區(qū),支持一鍵獲取DeepSeek系列模型,支持昇騰硬件平臺上開箱即用,推理快速部署,帶來更快、更高效、更便捷的AI開發(fā)和應用體驗。

          摩爾線程也于2月4日表示,作為國產全功能GPU創(chuàng)新企業(yè),摩爾線程快速實現對DeepSeek蒸餾模型推理服務的高效部署,旨在賦能更多開發(fā)者基于摩爾線程全功能GPU進行AI應用創(chuàng)新。

          各家算力主要面向推理

          可以看出,無論華為昇騰、天數智芯還是摩爾線程,均針對DeepSeek推理服務進行適配。

          隨著DeepSeek帶來大模型訪問量的暴增,推理芯片或將爆發(fā)。浙商證券認為,DeepSeek訓練和推理成本大幅降低將帶來大模型和用戶側準入門檻的同步降低,不僅帶來同等預算下模型側的迭代加速,“低成本+高性能”的模型也會加速推動企業(yè)和個人用戶對AI Agent、AI應用等的使用,從而推動AI商業(yè)化落地進程的顯著提速,在此背景下,推理環(huán)節(jié)的算力需求將得到激發(fā)。

          而算力廠商壁仞科技、云服務廠商優(yōu)刻得也強調推理效率的重要性。壁仞科技認為,推理效率已成為目前行業(yè)各公司發(fā)展的核心競爭力。憑借壁仞科技自主研發(fā)的壁礪TM系列產品出色的兼容性能,僅用數小時即完成對DeepSeek R1全系列蒸餾模型的支持,涵蓋了從1.5B到70B各等級參數版本,包括LLaMA蒸餾模型和千問蒸餾模型。為開發(fā)者提供高性能、低成本的大模型部署與開發(fā)解決方案。

          關于國產算力芯片適配DeepSeek的重要性,天數智芯副總裁宋煜表示:“目前,大模型生態(tài)上,訓練部分主要依賴CUDA+NVIDIA GPU,國產GPU的適配仍需突破。與DeepSeek合作,能加速國產GPU芯片的深度學習框架優(yōu)化、算子優(yōu)化、分布式訓練適配,降低國產AI企業(yè)的遷移成本,打造‘國產算力+國產大模型’的閉環(huán)生態(tài)。”

          宋煜認為:“DeepSeek等國產大模型廠商的成功,離不開強大的算力支持。我們的目標是提供穩(wěn)定、可擴展、性價比高的GPU解決方案,推動國產大模型更快迭代、更高效部署。未來,我們可以進一步深化合作,包括聯(lián)合優(yōu)化AI訓練框架、開發(fā)定制化AI加速方案,更高效的分布式推理引擎等。”

          封面圖片來源:視覺中國-VCG21a06e33023

          如需轉載請與《每日經濟新聞》報社聯(lián)系。
          未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

          讀者熱線:4008890008

          特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現在本站,可聯(lián)系我們要求撤下您的作品。

          DeepSeek 模型 算力 GPU 摩爾線程

          歡迎關注每日經濟新聞APP

          每經經濟新聞官方APP

          0

          0

          国产日本精品在线观看_欧美日韩综合精品一区二区三区_97国产精品一区二区三区四区_国产中文字幕六九九九
        2. <acronym id="mz9d1"><output id="mz9d1"></output></acronym>

          <sub id="mz9d1"><ol id="mz9d1"><nobr id="mz9d1"></nobr></ol></sub>
              1. <sup id="mz9d1"></sup>
                一区二区三区欧美视频 | 亚洲真实迷奷系列在线播放 | 竹菊精品久久久久久久99 | 中文字幕在线一区精品 | 在线中文字幕亚洲日韩首页 | 亚洲国内偷拍福利 |