<cite id="apcyb"></cite>
  1. <dfn id="apcyb"><rp id="apcyb"></rp></dfn>

  2. <cite id="apcyb"><noscript id="apcyb"><address id="apcyb"></address></noscript></cite>

    <tt id="apcyb"></tt>
    每日經濟新聞
    要聞

    每經網首頁 > 要聞 > 正文

    “百模大戰”鏖戰正酣,“賣水人”過得如何?創業者、投資人這樣說

    每日經濟新聞 2024-03-22 17:40:23

    每經記者 姚亞楠    每經編輯 彭水萍

    “百模大戰”進入下半場,在大模型底座的國產化浪潮和應用層的火熱之外,一些原本并不起眼的中間層公司開始走入公眾視野。

    一個被反復提及的例子是,大洋彼岸一家名為Scale AI的數據服務公司被爆2023年年化收入運行率(annualized revenue run-rate)達到7.5億美元,猛增3倍,一躍成為當前收入最高的AI初創公司之一,比肩OpenAI。

    事實上,在底層大模型和最上層是各類應用之外,還有大量的中間環節,包括數據處理、模型訓練、工具開發等等,海外新興的大模型創業公司也大多集中在中間層和應用層。

    “當所有人都在掘金時,你就應該賣鏟子”,如今國內“百模大戰”鏖戰正酣,這些提供基礎設施服務的“賣水人”過得如何?近日,《每日經濟新聞》記者進行了多方采訪。

    行業淘汰賽提前拉開帷幕

    章磊此前在海外從事算法工作,深知數據的重要性,2017年回國后,他發現國內市場在數據基礎設施方面存在缺失,于是著手創立了星塵數據。

    訓練一個大模型,數據處理工作就要占到60%,對于ChatGPT引爆的這一輪AIGC創業潮,星塵數據的感受很直觀。“我們接到大模型和數據管理的訂單明顯增多,這類業務目前在公司占比有三成左右”,章磊向《每日經濟新聞》記者介紹稱,這一年來,隨著技術的演進和應用的深入,大模型公司的數據處理需求復雜度也隨之攀升:從最初的獲取基座模型預訓練的數據集,到對模型進行SFT(supervised fine-tuning)調整,進一步地,隨著行業應用的深入,出現了對特定垂直領域的定制化和專業化數據需求,以及對大模型能力進行評估的benchmark評測,數據處理的難度不斷加大。此外,在數據模態的演進過程中,客戶需求也從處理單一模態數據轉變為處理多模態數據集,模型的訓練過程也由靜態的數據處理轉向了動態的交互式人類反饋。

    得益于大模型的火熱,大洋彼岸一家名為Scale AI的數據服務公司2023年營收增長迅猛,一躍成為收入比肩OpenAI的AI初創公司之一,引發市場對數據服務的關注。在國內,雖然底層大模型掀起國產化浪潮,應用層生態迎來百花齊放,但章磊說,數據服務公司還沒有如愿迎來悶聲賺大錢的舒服日子;恰恰相反,隨著大模型客戶對數據服務要求的進一步提高,行業淘汰賽提前拉開帷幕,很多單純依靠廉價勞動力做純手工數據標注的公司已經倒下。

    “大模型公司對于高質量標注數據有著持續強烈的需求,但單純拼低價人力的數據標注商無法提供與之匹配的服務。此外,國內以自動駕駛公司為代表的客戶不僅回款慢,并且其采購體系存在一定問題,這使得國內數據標注行業很難以最高效率運行,不少公司直接被拖垮了”,章磊向記者分析稱。

    不過,市場需求仍在加速釋放,隨著科技大廠、算法公司等更多玩家參與其中,自動化標注及更智能的數據閉環產品涌現,整個行業正從勞動密集型向技術密集型轉變,新興的數據服務公司需要開拓出屬于自己的成長空間。

    章磊告訴記者,在AI數據的整個生命周期當中,數據標注只是其中非常小的一部分,星塵數據的應對策略是,從數據標注向搭建數據基礎設施進化,培養經驗豐富的數據策略專家,推出AI全生命周期數據管理平臺MorningStar,幫助客戶建立高效的數據閉環系統,實現數據價值最大化和模型效果最優化。

    投資“賣水人”,VC/PE有點糾結

    Scale AI如今估值超70億美元,背后有Y Combinator、Tiger Globa等諸多知名機構支持,國內投資人如何看待這波“賣水人”的機遇?

    創世伙伴資本合伙人聶冬辰長期關注AI領域的早期投資機遇,過去一年,圍繞著AIGC這座金礦,以及金礦邊的“賣水人”,聶冬辰看過很多項目,他看好包括數據處理、模型訓練、工具開發在內的中間環節短期內存在一定的創業與投資機遇。

    “AIGC這個產業鏈上,最賺錢的環節要么是大模型底座,要么是離用戶更近的上層應用,中間環節相比上下游來看,天花板和價值可能相對偏低一些”,聶冬辰表示。

    九合創投創始人王嘯也認可中間環節的價值,“大模型部署到業務流程中,有適配的成本,使用大模型有訓練和推理成本,中間層可以幫助使用大模型的企業降本增效”。不過,當前大模型公司的主要目標是交付更高水平的大模型,到實現商業化還有一段距離。長期來看,大模型公司需要找到商業化的路徑,王嘯擔心這個過程可能會擠壓“賣水人”的利潤,因此,現階段他更關注應用層的機會。

    王嘯向記者舉例稱,九合創投在國內也看到過類似Scale AI的項目,“但國內和國外的商業環境不同,國內的AI公司更關注數據能否和模型業務更好的貼合,大多傾向于在公司內部處理數據,以更好的控制數據質量”。

    不過,上述擔憂并非無解,聶冬辰認為,對于這類公司而言,出海是一個很好的選擇。海外市場產業鏈分工更清晰明確,企業付費意識普遍更強,這些公司面臨上下游公司的擠壓會少一些,“如果產品能力足夠強,有能力進入到海外巨大的市場,那么企業的成長空間還是足夠大的”。

    市場“日更”,創業者心態變了

    在近來與創業者的接觸中,聶冬辰明顯感覺到創始人的心態有了很大變化,“去年大模型剛誕生時,我們接觸到的創業者大多斗志昂揚,充滿期待憧憬,摩拳擦掌想要做出點什么來。但今年以來,尤其是文生視頻大模型Sora橫空出世,很多創業者的感受是無奈”,聶冬辰說,OpenAI的一次產品迭代可能就瞬間抹掉了部分創業者一年來的技術積累和優勢,游戲規則頃刻改變。

    不過,即便在大模型在以“日更”進展的當下,聶冬辰認為,部分領域依然存在機會,值得創業者努力。首先是垂直領域模型,這些行業由于其數據的獨特性和封閉性,往往難以被OpenAI或大型科技公司的通用模型所充分覆蓋,創業者如果專注于這些數據壁壘較高的領域,利用對行業深入的理解和專業知識,可以開發出針對這些行業的定制化模型。

    其次是硬件領域,OpenAI作為一家以軟件為核心的公司,未來會持續提升其模型的性能,同時積極尋找市場上的新興應用,整合到其基礎功能中以擴展軟件的覆蓋范圍,但是對于與硬件直接相關的領域,OpenAI可能不會親自投入太多精力,中國公司在智能硬件制造方面有很強的實力,大模型與智能硬件的結合是他今年重點關注的方向。

    “今年我們對大模型項目是否有造血能力的考察比重繼續在增加”,王嘯告訴《每日經濟新聞》記者,在大模型訓練成本普遍較高的情況下,創業公司要更加關注變現,在當前的環境下如果自身造血能力短期內無法跟上,會非常考驗團隊的融資能力。今年他將對大模型應用層的機會持續保持關注,包括多模態的發展、具身智能、垂直行業AI應用、To C應用場景等。

    封面圖片來源:視覺中國-VCG41N1408722861

    如需轉載請與《每日經濟新聞》報社聯系。
    未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

    讀者熱線:4008890008

    特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

    數據 模型 投資 創業 基金投資

    歡迎關注每日經濟新聞APP

    每經經濟新聞官方APP

    0

    0

    国产日本精品在线观看_欧美日韩综合精品一区二区三区_97国产精品一区二区三区四区_国产中文字幕六九九九
    <cite id="apcyb"></cite>
    1. <dfn id="apcyb"><rp id="apcyb"></rp></dfn>

    2. <cite id="apcyb"><noscript id="apcyb"><address id="apcyb"></address></noscript></cite>

      <tt id="apcyb"></tt>