<cite id="apcyb"></cite>

<dfn id="apcyb"><rp id="apcyb"></rp></dfn>

<cite id="apcyb"><noscript id="apcyb"><address id="apcyb"></address></noscript></cite>

<tt id="apcyb"></tt>

每日經濟新聞

每經網首頁丨
宏觀丨
金融丨
公司丨
視頻丨
券商丨
IPO丨
基金丨
汽車丨
房產丨
新文化丨
未來商業丨
文創通丨
城市丨
每經商學院

要聞

每經網首頁 > 要聞 > 正文

大模型“混戰”，云端競爭時代到來

每日經濟新聞 2023-06-05 23:52:26

“現在大語言模型出現以后，云端就開始被開發出來，云端的競爭將成為下一場互聯網競爭的窗戶?！?/p>

每經記者石普寧每經編輯唐元

“國內現在是‘百模大戰’，這是通向通用人工智能最近的一條路。”在6月2日舉行的“未來城與智媒體”首屆成都東部新區·成渝地區雙城經濟圈城市媒體發展大會暨城市機會清單發布活動上，北京師范大學新聞傳播學院院長張洪忠表示，大模型讓所有的互聯網公司都有一個新的機會重新開始。

如何理解“大模型”？或許可以從架構上出發。簡單來說，如今的IT技術棧分為四層，芯片層、框架層、模型層和應用層。

“今天的ChatGPT、文心一言等屬于模型層，AI時代的原生應用都會基于大模型來開發。”百度CEO李彥宏在第七屆世界智能大會上曾如此說道。

自開春以來，隨著以大模型的應用為標志的AI2.0時代加速到來，人工智能概念大火。

在國內，以大廠領頭的各大企業紛紛宣布各自的大模型與產品，通用大模型也迎來一波創業潮，一時間市場上熱鬧紛呈，任何人都不愿錯失良機。

縱觀各類大模型產品的“出生”，其中既有來自熟悉的大廠如百度、阿里，也有來自專注人工智能領域的企業如商湯，更有創業者“另起爐灶”，典型如美團聯合創始人王慧文，稱要打造“中國的OpenAI”。

在“百?；鞈?rdquo;的背景下，如今各家的“戰況”如何，在大模型“一窩蜂”闖入視野的同時，我們正在迎接怎樣的科技變革？

各路產品業已上馬

“ChatGPT從去年11月份進入社會視野，有兩個最大的突破點：第一個是開放域的多輪對話，第二個是生成性的文本。”張洪忠表示，兩個技術的突破意味著人機交往的新時代到來，“這是一個巨大的革命性突破。”

視線投向國內互聯網巨頭，在大模型技術上積累較為深厚的百度和阿里率先出手，分別于3月16日與4月7日推出“文心一言”以及“通義千問”。

圖片來源：“百度文心一言”公眾號

自內測以來，文心一言完成了4次技術版本升級：如今的推理成本降到了原來的十分之一，推理性能提升近10倍。

“當別人剛剛思考如何進行訓練的時候，我們已經在推理上沖出了很遠。”5月，李彥宏在百度內部大會上說。

此外，文心一言還將逐步融入百度所有業務。

5月16日，百度發布了第一季度未經審計的財務報告，李彥宏表示，“我們計劃逐步將文心一言融入我們的所有業務，為我們的產品及服務賦能，吸引更廣泛的用戶及客戶。圍繞文心一言在新的時代中建立新生態。這也將助力我們實現長期、可持續的增長。”

無獨有偶，一個多月前，在阿里云峰會正式推出“通義千問”之際，阿里巴巴集團董事會主席兼CEO、阿里云智能集團CEO張勇亦表示，阿里巴巴所有產品未來將接入通義千問大模型并進行全面改造。“面向AI時代，所有產品都值得用大模型重新升級。”

6月1日，阿里云對外披露通義大模型最新進展，瞄向AI音視頻賽道推出“通義聽悟”，并且正式開啟公測。

據阿里云CTO周靖人介紹，通義聽悟作為一款工作學習AI助手，不僅“聽力好”，能夠高準確度生成會議記錄、區分不同發言人，而且“悟性極高”，可以一秒給音視頻劃分章節并形成摘要、總結全文及每個發言人觀點、整理關注重點和待辦事項。

圖片來源：“阿里云”公眾號

除了大廠動作頻頻之外，AI科技企業也對這塊“蛋糕”虎視眈眈。

4月，計算機視覺公司商湯科技于推出“日日新”（SenseNova），其中包括自然語言處理模型“商量”（SenseChat）、文生圖模型“秒畫”和數字人視頻生成平臺“如影”（SenseAvatar）等。

同月，決策類AI公司第四范式首次向公眾展示 “式說3.0”，瞄準生成式AI對企業級軟件重構和改變的增長空間和市場機會。

值得一提的是，就大模型產品而言，騰訊則“低調”不少，并不打算“拼速度”。

在3月騰訊發布2022年四季度財報后，騰訊總裁劉熾平透露了包括聊天機器人在內的即將發布的眾多產品的計劃。他表示，騰訊不會匆忙推出產品，而將花費時間打造一個經過多次迭代后的長期發展機會。

此外，大廠如字節跳動則選擇扮演類似微軟的角色，旗下的火山引擎推出大模型訓練云平臺，為大模型公司提供算力等技術服務。火山引擎總裁譚待表示，火山引擎不做大模型，將化身賦能者，為大模型客戶提供算力等AI基礎設施，幫助其做好大模型開發。

圖片來源：“火山引擎”公眾號

作業幫教育大模型正在內測

除了科技企業，記者從作業幫獲悉，目前作業幫正在內測基于中國市場的教育大模型，包含多學科解題、中英文作文批改、多語言對話方向等多個教育應用場景，涉及工具類App、智能硬件、圖書等業務。據內部人士透露，教育場景中綜合能力表現超出預期水平。

針對此事，財經網科技向作業幫方面進行求證，作業幫相關工作人員回復，作業幫教育大模型目前在內測階段，相關評估及備案等工作正在進行中。

一位接近作業幫人士表示，作業幫在今年年初就啟動了自研教育GPT項目，從各個業務模塊調集技術精英組成原始團隊。今年3月份，作業幫內部郵件宣布，再次加大投入，并進行組織架構調整。目前該項目由CTO羅亮牽頭進行底層研發支持及AIGC大方向建設，研發經費優先調撥。

該人士進一步表示，除了組織架構調整，作業幫產研團隊中近百人也已并入GPT相關項目，“從技術到產品側，分不同落地場景在‘跑’項目，估計有兩百人以上的團隊規模”。

另一位作業幫內部人士透露， “從過往技術能力積累來看，作業幫優勢明顯，不做這件事才奇怪。”該人士稱，經過半年的技術研發，作業幫內部對自研GPT比較有信心，已經優先“解鎖”解題能力、中英文作文批改、知識問答等產品級應用，進展比想象中順利，已經在一些教育場景中達到了行業top水平。

圖片來源：“作業幫”公眾號

云端競爭時代已經到來

“現在大語言模型出現以后，云端就開始被開發出來，云端的競爭將成為下一場互聯網競爭的窗戶。”張洪忠稱。

據Canalys數據顯示，去年中國云計算市場同比增長10%，前四大云計算廠商阿里云、華為云、騰訊云和百度智能云，合計增長9%，占云服務客戶支出總額的79%。

張洪忠認為，對于應用而言，“對話即平臺”成為現實，對話可以解決多模態的問題。例如，把ChatGPT的API接上以后，大模型就可以畫圖、做平面設計、寫文案等等。

而要更深層次理解大模型，“涌現”是一個關鍵的概念。

簡單來說，涌現指的是當大模型的數據量達到一定量的時候，一種產生質變的能力。這種能力在小型模型中并不存在。主攻預訓練大模型的智譜AI創始人、CEO張鵬在接受媒體采訪時指出，業界普遍的共識在于，500-600億機器訓練參數是大模型智能涌現的門檻。

這也是ChatGPT“大力出奇跡”的基礎，早前“掀起蝴蝶翅膀”的GPT-3模型，就已經有1750億個參數。OpenAI沒有進一步公布GPT-4的參數數量。作為對比，谷歌新推出的PaLM2訓練參數已經達到3400億個。

“算力是競爭的基礎，”張洪忠提到，目前很多想要從事相關研究的老師從大學轉到企業，就是因為大學無法承載如此龐大的算力需求以及巨額費用。

一個典型的例子是，作為算力基礎GPU的供應商英偉達，近日市值一度突破萬億美元，其A100芯片、H100芯片在全球具有絕對優勢。就國內的A100芯片而言，主要被百度、阿里等大廠掌握在手中。

英偉達CEO黃仁勛圖片來源：英偉達官網截圖

換句話說，大模型產品競爭費用不菲，這也是一些國內大模型產品采用邀請測試或是不面向C端的主要考慮。

據國盛證券估算，GPT-3的單次訓練成本就高達140萬美元，對于一些更大的LLM（大型語言模型），訓練成本介于200萬美元至1200萬美元之間。

在這其中，大部分費用是電費，計算機專家吳軍曾提到，“大概可能是3000輛特斯拉的電動汽車，每輛跑到20萬英里（約32.19萬公里），把它跑‘死’，這么大的耗電量，才夠ChatGPT訓練一次。”

在如此高昂成本之下，各互聯網大廠也爭相入場，或許都是因為看重大模型產品背后掙到“真金白銀”的可能。

李彥宏就提道，初創企業“沒有必要再重新發明一遍輪子（基礎大模型）”，它們的機會是在應用層，將出現“全新的、十倍于現在微信和抖音的創業機遇”。當然，百度自己想要做“輪子”。

在張洪忠看來，互聯網經歷了三大時代：PC互聯網時代，2010年之后的移動互聯網時代，以及可能進入的下一個時代——大模型時代。他表示，“我們未來的互聯網競爭，幾乎都要建立在大模型基礎上。”

他進一步提到，移動互聯網時代，誰都想不到當時如日中天的四大門戶——新浪、騰訊、網易、搜狐會在這一波浪潮之中被抖音、快手、微信等應用所取代和趕超。

“同樣的，今天我們到了大模型時代，在大模型基礎之上的應用就可能會產生新的技術，這就是人工智能技術帶給我們的希望和變數，包括一些新的產業發展契機。”

本文作者系天府文創云記者石普寧，轉載合作相關可搜索“天府文創云”公眾號。

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯系索取稿酬。如您不希望作品出現在本站，可聯系我們要求撤下您的作品。

“國內現在是‘百模大戰’，這是通向通用人工智能最近的一條路?！痹?月2日舉行的“未來城與智媒體”首屆成都東部新區·成渝地區雙城經濟圈城市媒體發展大會暨城市機會清單發布活動上，北京師范大學新聞傳播學院院長張洪忠表示，大模型讓所有的互聯網公司都有一個新的機會重新開始。如何理解“大模型”？或許可以從架構上出發。簡單來說，如今的IT技術棧分為四層，芯片層、框架層、模型層和應用層。 “今天的ChatGPT、文心一言等屬于模型層，AI時代的原生應用都會基于大模型來開發?！卑俣菴EO李彥宏在第七屆世界智能大會上曾如此說道。自開春以來，隨著以大模型的應用為標志的AI2.0時代加速到來，人工智能概念大火。在國內，以大廠領頭的各大企業紛紛宣布各自的大模型與產品，通用大模型也迎來一波創業潮，一時間市場上熱鬧紛呈，任何人都不愿錯失良機。縱觀各類大模型產品的“出生”，其中既有來自熟悉的大廠如百度、阿里，也有來自專注人工智能領域的企業如商湯，更有創業者“另起爐灶”，典型如美團聯合創始人王慧文，稱要打造“中國的OpenAI”。在“百?；鞈稹钡谋尘跋?，如今各家的“戰況”如何，在大模型“一窩蜂”闖入視野的同時，我們正在迎接怎樣的科技變革？各路產品業已上馬 “ChatGPT從去年11月份進入社會視野，有兩個最大的突破點：第一個是開放域的多輪對話，第二個是生成性的文本?！睆埡橹冶硎荆瑑蓚€技術的突破意味著人機交往的新時代到來，“這是一個巨大的革命性突破?！? 視線投向國內互聯網巨頭，在大模型技術上積累較為深厚的百度和阿里率先出手，分別于3月16日與4月7日推出“文心一言”以及“通義千問”。圖片來源：“百度文心一言”公眾號自內測以來，文心一言完成了4次技術版本升級：如今的推理成本降到了原來的十分之一，推理性能提升近10倍。 “當別人剛剛思考如何進行訓練的時候，我們已經在推理上沖出了很遠?！?月，李彥宏在百度內部大會上說。此外，文心一言還將逐步融入百度所有業務。 5月16日，百度發布了第一季度未經審計的財務報告，李彥宏表示，“我們計劃逐步將文心一言融入我們的所有業務，為我們的產品及服務賦能，吸引更廣泛的用戶及客戶。圍繞文心一言在新的時代中建立新生態。這也將助力我們實現長期、可持續的增長?！? 無獨有偶，一個多月前，在阿里云峰會正式推出“通義千問”之際，阿里巴巴集團董事會主席兼CEO、阿里云智能集團CEO張勇亦表示，阿里巴巴所有產品未來將接入通義千問大模型并進行全面改造?！懊嫦駻I時代，所有產品都值得用大模型重新升級?！? 6月1日，阿里云對外披露通義大模型最新進展，瞄向AI音視頻賽道推出“通義聽悟”，并且正式開啟公測。據阿里云CTO周靖人介紹，通義聽悟作為一款工作學習AI助手，不僅“聽力好”，能夠高準確度生成會議記錄、區分不同發言人，而且“悟性極高”，可以一秒給音視頻劃分章節并形成摘要、總結全文及每個發言人觀點、整理關注重點和待辦事項。圖片來源：“阿里云”公眾號除了大廠動作頻頻之外，AI科技企業也對這塊“蛋糕”虎視眈眈。 4月，計算機視覺公司商湯科技于推出“日日新”（SenseNova），其中包括自然語言處理模型“商量”（SenseChat）、文生圖模型“秒畫”和數字人視頻生成平臺“如影”（SenseAvatar）等。同月，決策類AI公司第四范式首次向公眾展示“式說3.0”，瞄準生成式AI對企業級軟件重構和改變的增長空間和市場機會。值得一提的是，就大模型產品而言，騰訊則“低調”不少，并不打算“拼速度”。在3月騰訊發布2022年四季度財報后，騰訊總裁劉熾平透露了包括聊天機器人在內的即將發布的眾多產品的計劃。他表示，騰訊不會匆忙推出產品，而將花費時間打造一個經過多次迭代后的長期發展機會。此外，大廠如字節跳動則選擇扮演類似微軟的角色，旗下的火山引擎推出大模型訓練云平臺，為大模型公司提供算力等技術服務?；鹕揭婵偛米T待表示，火山引擎不做大模型，將化身賦能者，為大模型客戶提供算力等AI基礎設施，幫助其做好大模型開發。圖片來源：“火山引擎”公眾號作業幫教育大模型正在內測除了科技企業，記者從作業幫獲悉，目前作業幫正在內測基于中國市場的教育大模型，包含多學科解題、中英文作文批改、多語言對話方向等多個教育應用場景，涉及工具類App、智能硬件、圖書等業務。據內部人士透露，教育場景中綜合能力表現超出預期水平。針對此事，財經網科技向作業幫方面進行求證，作業幫相關工作人員回復，作業幫教育大模型目前在內測階段，相關評估及備案等工作正在進行中。一位接近作業幫人士表示，作業幫在今年年初就啟動了自研教育GPT項目，從各個業務模塊調集技術精英組成原始團隊。今年3月份，作業幫內部郵件宣布，再次加大投入，并進行組織架構調整。目前該項目由CTO羅亮牽頭進行底層研發支持及AIGC大方向建設，研發經費優先調撥。該人士進一步表示，除了組織架構調整，作業幫產研團隊中近百人也已并入GPT相關項目，“從技術到產品側，分不同落地場景在‘跑’項目，估計有兩百人以上的團隊規?！薄? 另一位作業幫內部人士透露，“從過往技術能力積累來看，作業幫優勢明顯，不做這件事才奇怪?！痹撊耸糠Q，經過半年的技術研發，作業幫內部對自研GPT比較有信心，已經優先“解鎖”解題能力、中英文作文批改、知識問答等產品級應用，進展比想象中順利，已經在一些教育場景中達到了行業top水平。圖片來源：“作業幫”公眾號云端競爭時代已經到來 “現在大語言模型出現以后，云端就開始被開發出來，云端的競爭將成為下一場互聯網競爭的窗戶?！睆埡橹曳Q。據Canalys數據顯示，去年中國云計算市場同比增長10%，前四大云計算廠商阿里云、華為云、騰訊云和百度智能云，合計增長9%，占云服務客戶支出總額的79%。張洪忠認為，對于應用而言，“對話即平臺”成為現實，對話可以解決多模態的問題。例如，把ChatGPT的API接上以后，大模型就可以畫圖、做平面設計、寫文案等等。而要更深層次理解大模型，“涌現”是一個關鍵的概念。簡單來說，涌現指的是當大模型的數據量達到一定量的時候，一種產生質變的能力。這種能力在小型模型中并不存在。主攻預訓練大模型的智譜AI創始人、CEO張鵬在接受媒體采訪時指出，業界普遍的共識在于，500-600億機器訓練參數是大模型智能涌現的門檻。這也是ChatGPT“大力出奇跡”的基礎，早前“掀起蝴蝶翅膀”的GPT-3模型，就已經有1750億個參數。OpenAI沒有進一步公布GPT-4的參數數量。作為對比，谷歌新推出的PaLM2訓練參數已經達到3400億個。 “算力是競爭的基礎，”張洪忠提到，目前很多想要從事相關研究的老師從大學轉到企業，就是因為大學無法承載如此龐大的算力需求以及巨額費用。一個典型的例子是，作為算力基礎GPU的供應商英偉達，近日市值一度突破萬億美元，其A100芯片、H100芯片在全球具有絕對優勢。就國內的A100芯片而言，主要被百度、阿里等大廠掌握在手中。英偉達CEO黃仁勛圖片來源：英偉達官網截圖換句話說，大模型產品競爭費用不菲，這也是一些國內大模型產品采用邀請測試或是不面向C端的主要考慮。據國盛證券估算，GPT-3的單次訓練成本就高達140萬美元，對于一些更大的LLM（大型語言模型），訓練成本介于200萬美元至1200萬美元之間。在這其中，大部分費用是電費，計算機專家吳軍曾提到，“大概可能是3000輛特斯拉的電動汽車，每輛跑到20萬英里（約32.19萬公里），把它跑‘死’，這么大的耗電量，才夠ChatGPT訓練一次?！? 在如此高昂成本之下，各互聯網大廠也爭相入場，或許都是因為看重大模型產品背后掙到“真金白銀”的可能。李彥宏就提道，初創企業“沒有必要再重新發明一遍輪子（基礎大模型）”，它們的機會是在應用層，將出現“全新的、十倍于現在微信和抖音的創業機遇”。當然，百度自己想要做“輪子”。在張洪忠看來，互聯網經歷了三大時代：PC互聯網時代，2010年之后的移動互聯網時代，以及可能進入的下一個時代——大模型時代。他表示，“我們未來的互聯網競爭，幾乎都要建立在大模型基礎上?！? 他進一步提到，移動互聯網時代，誰都想不到當時如日中天的四大門戶——新浪、騰訊、網易、搜狐會在這一波浪潮之中被抖音、快手、微信等應用所取代和趕超。 “同樣的，今天我們到了大模型時代，在大模型基礎之上的應用就可能會產生新的技術，這就是人工智能技術帶給我們的希望和變數，包括一些新的產業發展契機?！? 本文作者系天府文創云記者石普寧，轉載合作相關可搜索“天府文創云”公眾號。

大模型

上一篇文章

幣安CEO趙長鵬：團隊將確保系統穩定，包括提款和存款

返回每經網首頁

下一篇文章

西南水電大省，何時才能“解渴”？

相關文章

熱文精選

點擊排行

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

相關信息
關于我們
版權聲明

關注我們
辟謠專區

加入我們
招聘專頁

Copyright ? 2024 每日經濟新聞報社版權所有，未經許可不得轉載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網絡社會征信網

兒童色情信息舉報專區

成都市互聯網不良與違法信息舉報中心

四川省互聯網舉報中心

中國互聯網舉報中心

每日經濟新聞互聯網不良與違法信息舉報中心

互聯網新聞信息服務許可證：51120190017 網站備案號：蜀ICP備19004508號-3 川公網安備 51019002002026號

新聞職業道德監督熱線：400 889 0008 郵箱：zbb@nbd.com.cn

国产日本精品在线观看_欧美日韩综合精品一区二区三区_97国产精品一区二区三区四区_国产中文字幕六九九九

<cite id="apcyb"></cite>

<dfn id="apcyb"><rp id="apcyb"></rp></dfn>

<cite id="apcyb"><noscript id="apcyb"><address id="apcyb"></address></noscript></cite>

<tt id="apcyb"></tt>