今日報紙

零一萬物新產品閃電模型接棒“耐力賽”

每日經濟新聞 2024-10-17 21:38:20

每經記者趙雯琪每經編輯楊夏

發布千億參數模型YiLarge 5個月后，零一萬物創始人兼CEO李開復再次帶著新產品公開亮相。

10月16日，零一萬物正式發布新的預訓練模型Yi-Lightning（直譯為閃電模型）。選擇在此時發布新產品，或許是為了用實際行動回應市場猜測。前段時間，國內大模型創業公司“六小虎”（智譜AI、百川智能、零一萬物、月之暗面、Minimax、階躍星辰）均受到不同程度的質疑，零一萬物更是被直指放棄了預訓練。

視覺中國

對此，零一萬物創始人兼CEO李開復在新品發布后接受包括每日經濟新聞在內的媒體采訪時表示，零一萬物絕不會放棄預訓練模型工作。值得一提的是，在To B（面向企業端）戰略下，零一萬物首次發布了針對零售和電商等場景的行業應用產品AI 2.0數字人，并已在彈幕互動、商品信息提取、實時話術生成等環節接入了Yi-Lightning。

進入2024年，中國大模型行業從狂奔進入到了“長跑階段”。從技術側和產業側都引發了行業的進一步思考，頭部企業開始探索更多商業化方向。今年8月，月之暗面創始人楊植麟開始將一部分精力放到B端業務上，他們正式發布了Kimi企業級API，以探索在B端的商業模式。百川智能則與國家兒童醫學中心北京兒童醫院簽署戰略合作協議，雙方計劃共同推出“一大四小”五款AI醫療產品。

李開復表示，中國大模型產業進入到了“耐力賽”階段，如何讓大模型賦能千行百業，提升企業新質生產力是一個重要的命題。這不僅將牽涉到“大模型＋行業”的未來發展方向，甚至會影響世界的創新版圖。

預訓練一次數百萬美元

據李開復分享，在LMSYS盲測競技場總榜（用戶對一組大模型回答進行盲投的榜單）上，零一萬物最新發布的Yi-Lightning位列第六，僅次于OpenAI的GPT-4o、o1系列，以及Google的Gemini 1.5 pro系列，與馬斯克xAI旗下Grok-2打平。這是中國大模型廠商目前在該榜單上取得的最好成績。

此外，閃電模型的發布，也是李開復對于“零一萬物放棄預訓練”市場傳言的回擊。

他表示，GPT新發布o1之后，給零一萬物團隊帶來了新靈感，“一年半以前大家覺得大模型最厲害的地方就是預訓練，一年以后發現Post train（后訓練）也是同樣重要的，感謝OpenAI點醒我們這一點。”不過，李開復提到，后訓練的重要性變高，不代表要徹底放棄預訓練。

根據公開信息，大模型預訓練是在大規模數據集上進行的初步訓練，旨在讓模型學習通用的語言知識和模式。而后訓練則是在預訓練的基礎上，針對特定任務進行的進一步優化和調整，以使模型在該任務上表現得更加出色。

李開復表示，他認為做好預訓練模型是一個技術活，而且是要非常多有才華的人在一起工作，慢工出細活，需要有懂芯片的人，懂推理的人，懂基礎架構的人，懂模型的人，一起做出來。不過他也坦言，不是每家公司都可以做這件事情，因為成本比較高，以后做預訓練的大模型公司可能會越來越少。但他明確表態，零一萬物絕不放棄預訓練。

《每日經濟新聞》記者也發現，今年以來，有一批大模型公司停下了研發的腳步。據經濟觀察網統計，截至2024年10月9日，在188個通過網信辦生成式人工智能備案的大模型中，超過三成的大模型在通過備案后未進一步公開進展情況，僅有約一成的大模型仍在加速訓練，接近一半的大模型轉向了AI應用的開發。

據李開復透露，做預訓練的Production Run（投產運行）的訓練成本是一次三四百萬美元。“‘六小虎’的融資額度都是夠的，這個錢頭部公司都付得起。我覺得中國的六家大模型公司只要有夠好的人才，如果有想做預訓練的決心，資金和芯片算力都不是問題。”李開復表示。

探索To B商業空間

值得一提的是，創業一年，李開復帶領零一萬物開始加速探索商業化落地和更多賺錢的機會。

曾公開宣布不打“價格戰”的李開復將Yi-Lightning定價在0.99元/百萬tokens。對此，李開復表示，這并不是一個虧本的價格，公司仍有相對理想的利潤空間。除此之外，零一萬物也首次對外發布其To B戰略下的首發行業應用產品AI 2.0數字人，聚焦零售和電商等場景，將最新版旗艦模型Yi-Lightning實踐于具體行業解決方案。

據零一萬物透露，目前零一萬物數字人的合作案例包括全國某著名餐飲連鎖、某頭部酒旅類客戶、全國某知名水果連鎖店等，均取得了顯著的GMV（商品交易總額）提升。其中，某頭部酒旅企業在接入Yi-Lightning全新加持的數字人直播后，GMV較此前上升170%。

除直播外，零一萬物也為數字人客戶準備了AI 2.0門店短視頻解決方案?？蛻艨赏ㄟ^極簡流程，隨時生成超低成本的高品質營銷視頻，解決了傳統真人短視頻的成本和制作周期問題。短視頻與直播內容相互配合，為商品提供持續曝光，提升轉化率。

這也意味著，在通用大模型產品迭代之外，零一萬物也在探索更多的商業化落地方向。《每日經濟新聞》記者了解到，零一萬物今年下半年開始在To B解決方案上加速布局，6月份以來，零一萬物相繼宣布與阿里云、360、順豐科技、飛書、釘釘、鈦動科技等頭部企業達成合作。

實際上，不僅是零一萬物，經過一年多的“百模大戰”，大部分大模型公司都從技術浪漫走到落地求生階段?！睹咳战洕侣劇酚浾吒鶕_信息發現，今年以來，月之暗面、百川智能、智譜AI等大模型公司都在探索商業化和B端運用場景。

李開復感嘆，一個大模型公司同時做To B和To C（用戶端）是很辛苦的，需要多元化的管理方式，因為兩個團隊的基因不一樣，做事的方法和衡量KPI（關鍵績效指標）的方法都不太一樣，不過零一萬物根據不同的市場特性進行海內外市場的商業化布局。

具體來說，零一萬物將C端產品商業化重心放在海外市場，因為“國內流量越來越貴，而國外的C端產品，獲客成本和變現能力能算得過賬”。在國內，零一萬物優先尋找B端機會，李開復表示，零一萬物已經找到了破局的空間，就是用數字人做零售和餐飲等領域的直播和短視頻，做完整的解決方案。

李開復重申了“不做賠錢的To B”這一觀點，他稱零一萬物大模型To B的打法，首要任務是要尋找少數能夠按使用情況收費的方法，拿到高利潤率的訂單，而不是項目定制的方法。他同時透露，除了已經發布的AI 2.0數字人、API之外，零一萬物目前還有AI Infra解決方案、私有化定制模型等其他To B業務，會在近期正式對外發布。

不用執著于縮短時間差

提到國內大模型，有一個永遠繞不開的問題，就是中國與美國頂尖大模型技術的差距有多大？經過過去一年的百花齊放，中美大模型差距是否縮?。咳绾巫汾s國外頂尖大模型？

對此，李開復給出了具體數字：GPT-4o在5月13日發布，Yi-Lightening在10月把它打敗，零一萬物和美國頂尖模型之間的差距是5個月，而在5個月前發布千億參數Yi-Large閉源模型時，李開復的答案是6個月，在他看來，這已經是全體國內創業者努力的最好結果。

當被問及中國大模型如何繼續和美國大模型縮短時間差時，李開復坦言，繼續縮短時間差非常困難，“我不預測我們可以縮短這個時間差”。

“畢竟人家是用10萬張GPU（圖形處理器）訓練出來的，我們是用2000張GPU訓練出來，我們時間差能縮小到5個月是因為我們模型、AI infra（人工智能基礎設施）等團隊都熱心且聰明，去使用和理解對方做出來的東西，再加上我們自己每家的研發有特色，比如數據處理、訓推優化等。”李開復表示。

據他透露，零一萬物目前的成熟方法論就是，通過創新加上自身的特長，關注OpenAI和其他公司發布的新技術，盡快了解這些技術的核心，然后把它的能力在自身的產品里面發揮出來。

“我覺得用這套方法將中美大模型差距保持在6個月左右，而且國內不僅是零一萬物，也有其他公司做得差不多，已經是很好的結果了，很多中美公司都在往GPT-o1的方向狂奔。”李開復表示。

封面圖片來源：視覺中國

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯系索取稿酬。如您不希望作品出現在本站，可聯系我們要求撤下您的作品。

發布千億參數模型YiLarge 5個月后，零一萬物創始人兼CEO李開復再次帶著新產品公開亮相。 10月16日，零一萬物正式發布新的預訓練模型Yi-Lightning（直譯為閃電模型）。選擇在此時發布新產品，或許是為了用實際行動回應市場猜測。前段時間，國內大模型創業公司“六小虎”（智譜AI、百川智能、零一萬物、月之暗面、Minimax、階躍星辰）均受到不同程度的質疑，零一萬物更是被直指放棄了預訓練。視覺中國對此，零一萬物創始人兼CEO李開復在新品發布后接受包括每日經濟新聞在內的媒體采訪時表示，零一萬物絕不會放棄預訓練模型工作。值得一提的是，在To B（面向企業端）戰略下，零一萬物首次發布了針對零售和電商等場景的行業應用產品AI 2.0數字人，并已在彈幕互動、商品信息提取、實時話術生成等環節接入了Yi-Lightning。進入2024年，中國大模型行業從狂奔進入到了“長跑階段”。從技術側和產業側都引發了行業的進一步思考，頭部企業開始探索更多商業化方向。今年8月，月之暗面創始人楊植麟開始將一部分精力放到B端業務上，他們正式發布了Kimi企業級API，以探索在B端的商業模式。百川智能則與國家兒童醫學中心北京兒童醫院簽署戰略合作協議，雙方計劃共同推出“一大四小”五款AI醫療產品。李開復表示，中國大模型產業進入到了“耐力賽”階段，如何讓大模型賦能千行百業，提升企業新質生產力是一個重要的命題。這不僅將牽涉到“大模型＋行業”的未來發展方向，甚至會影響世界的創新版圖。預訓練一次數百萬美元據李開復分享，在LMSYS盲測競技場總榜（用戶對一組大模型回答進行盲投的榜單）上，零一萬物最新發布的Yi-Lightning位列第六，僅次于OpenAI的GPT-4o、o1系列，以及Google的Gemini 1.5 pro系列，與馬斯克xAI旗下Grok-2打平。這是中國大模型廠商目前在該榜單上取得的最好成績。此外，閃電模型的發布，也是李開復對于“零一萬物放棄預訓練”市場傳言的回擊。他表示，GPT新發布o1之后，給零一萬物團隊帶來了新靈感，“一年半以前大家覺得大模型最厲害的地方就是預訓練，一年以后發現Post train（后訓練）也是同樣重要的，感謝OpenAI點醒我們這一點?！辈贿^，李開復提到，后訓練的重要性變高，不代表要徹底放棄預訓練。根據公開信息，大模型預訓練是在大規模數據集上進行的初步訓練，旨在讓模型學習通用的語言知識和模式。而后訓練則是在預訓練的基礎上，針對特定任務進行的進一步優化和調整，以使模型在該任務上表現得更加出色。李開復表示，他認為做好預訓練模型是一個技術活，而且是要非常多有才華的人在一起工作，慢工出細活，需要有懂芯片的人，懂推理的人，懂基礎架構的人，懂模型的人，一起做出來。不過他也坦言，不是每家公司都可以做這件事情，因為成本比較高，以后做預訓練的大模型公司可能會越來越少。但他明確表態，零一萬物絕不放棄預訓練。《每日經濟新聞》記者也發現，今年以來，有一批大模型公司停下了研發的腳步。據經濟觀察網統計，截至2024年10月9日，在188個通過網信辦生成式人工智能備案的大模型中，超過三成的大模型在通過備案后未進一步公開進展情況，僅有約一成的大模型仍在加速訓練，接近一半的大模型轉向了AI應用的開發。據李開復透露，做預訓練的Production Run（投產運行）的訓練成本是一次三四百萬美元?！啊』ⅰ娜谫Y額度都是夠的，這個錢頭部公司都付得起。我覺得中國的六家大模型公司只要有夠好的人才，如果有想做預訓練的決心，資金和芯片算力都不是問題?！崩铋_復表示。探索To B商業空間值得一提的是，創業一年，李開復帶領零一萬物開始加速探索商業化落地和更多賺錢的機會。曾公開宣布不打“價格戰”的李開復將Yi-Lightning定價在0.99元/百萬tokens。對此，李開復表示，這并不是一個虧本的價格，公司仍有相對理想的利潤空間。除此之外，零一萬物也首次對外發布其To B戰略下的首發行業應用產品AI 2.0數字人，聚焦零售和電商等場景，將最新版旗艦模型Yi-Lightning實踐于具體行業解決方案。據零一萬物透露，目前零一萬物數字人的合作案例包括全國某著名餐飲連鎖、某頭部酒旅類客戶、全國某知名水果連鎖店等，均取得了顯著的GMV（商品交易總額）提升。其中，某頭部酒旅企業在接入Yi-Lightning全新加持的數字人直播后，GMV較此前上升170%。除直播外，零一萬物也為數字人客戶準備了AI 2.0門店短視頻解決方案。客戶可通過極簡流程，隨時生成超低成本的高品質營銷視頻，解決了傳統真人短視頻的成本和制作周期問題。短視頻與直播內容相互配合，為商品提供持續曝光，提升轉化率。這也意味著，在通用大模型產品迭代之外，零一萬物也在探索更多的商業化落地方向?！睹咳战洕侣劇酚浾吡私獾?，零一萬物今年下半年開始在To B解決方案上加速布局，6月份以來，零一萬物相繼宣布與阿里云、360、順豐科技、飛書、釘釘、鈦動科技等頭部企業達成合作。實際上，不僅是零一萬物，經過一年多的“百模大戰”，大部分大模型公司都從技術浪漫走到落地求生階段。《每日經濟新聞》記者根據公開信息發現，今年以來，月之暗面、百川智能、智譜AI等大模型公司都在探索商業化和B端運用場景。李開復感嘆，一個大模型公司同時做To B和To C（用戶端）是很辛苦的，需要多元化的管理方式，因為兩個團隊的基因不一樣，做事的方法和衡量KPI（關鍵績效指標）的方法都不太一樣，不過零一萬物根據不同的市場特性進行海內外市場的商業化布局。具體來說，零一萬物將C端產品商業化重心放在海外市場，因為“國內流量越來越貴，而國外的C端產品，獲客成本和變現能力能算得過賬”。在國內，零一萬物優先尋找B端機會，李開復表示，零一萬物已經找到了破局的空間，就是用數字人做零售和餐飲等領域的直播和短視頻，做完整的解決方案。李開復重申了“不做賠錢的To B”這一觀點，他稱零一萬物大模型To B的打法，首要任務是要尋找少數能夠按使用情況收費的方法，拿到高利潤率的訂單，而不是項目定制的方法。他同時透露，除了已經發布的AI 2.0數字人、API之外，零一萬物目前還有AI Infra解決方案、私有化定制模型等其他To B業務，會在近期正式對外發布。不用執著于縮短時間差提到國內大模型，有一個永遠繞不開的問題，就是中國與美國頂尖大模型技術的差距有多大？經過過去一年的百花齊放，中美大模型差距是否縮??？如何追趕國外頂尖大模型？對此，李開復給出了具體數字：GPT-4o在5月13日發布，Yi-Lightening在10月把它打敗，零一萬物和美國頂尖模型之間的差距是5個月，而在5個月前發布千億參數Yi-Large閉源模型時，李開復的答案是6個月，在他看來，這已經是全體國內創業者努力的最好結果。當被問及中國大模型如何繼續和美國大模型縮短時間差時，李開復坦言，繼續縮短時間差非常困難，“我不預測我們可以縮短這個時間差”。 “畢竟人家是用10萬張GPU（圖形處理器）訓練出來的，我們是用2000張GPU訓練出來，我們時間差能縮小到5個月是因為我們模型、AI infra（人工智能基礎設施）等團隊都熱心且聰明，去使用和理解對方做出來的東西，再加上我們自己每家的研發有特色，比如數據處理、訓推優化等。”李開復表示。據他透露，零一萬物目前的成熟方法論就是，通過創新加上自身的特長，關注OpenAI和其他公司發布的新技術，盡快了解這些技術的核心，然后把它的能力在自身的產品里面發揮出來。 “我覺得用這套方法將中美大模型差距保持在6個月左右，而且國內不僅是零一萬物，也有其他公司做得差不多，已經是很好的結果了，很多中美公司都在往GPT-o1的方向狂奔?！崩铋_復表示。翻譯搜索復制

模型零一萬物

上一篇文章

返回每經網首頁

下一篇文章

每經熱評｜防止內卷現象發生促進經濟社會健康發展

熱文精選

點擊排行

歡迎關注每日經濟新聞APP