每日經濟新聞 2023-09-12 20:25:22
值得關注的是,在“百模大戰”的大浪淘沙下,剩下的“選手”數量最終可能僅僅是個位數。對于大多數企業而言,如何考慮更早在應用層發力,或是更為值得思考的地方。
每經記者 石普寧 每經編輯 唐元
半年前,也許你身邊只有“技術大牛”在研究大模型,而現在,經歷了一波擔心被AI替代的打工人,已經學會與之“共存”,并讓自己更靠近大模型。而這種靠近的基礎,在于企業的“百模大戰”已來到一定的層級。
上個月底,多家公司表示旗下的國產大模型產品向全社會開放。而這距離國內較早的大模型產品公開發布還不到半年,大模型發展速度有著迅雷不及掩耳之勢。
數據顯示,截至2023年7月,中國累計已有130個大模型問世。毫無疑問,參與這場“百模競賽”的任何一家廠商都不想錯失這條看似蘊含無限商機的賽道。
記者認為,競賽的實質是一場“云計算之爭”。而這背后,大模型產品好不好用,還是要看能不能解決實際問題。
在此背景下,各大廠商亦在強調其應用層面的優勢,特別是在結合垂直行業的場景中。目前看來,大模型與行業的融合發展已是主要趨勢,具體的場景還在逐步探索,一批典型案例則已經發布。
率先發布大模型產品并投入應用,對企業而言的正向效應在于產生“數據飛輪效應”:即更多用戶帶來更多的數據,以此“反哺”更好的大模型,并無限循環。
值得關注的是,在“百模大戰”的大浪淘沙下,剩下的“選手”數量最終可能僅僅是個位數。對于大多數企業而言,如何考慮更早在應用層發力,或是更為值得思考的地方。
對普通用戶而言,如今要使用一款大模型更多需要考慮的是用哪一款,而不是“一模莫展”。
8月31日凌晨,百度“文心一言”、智譜AI“智譜清言”、商湯科技“商量”、百川智能“百川大模型”等公司紛紛表示,旗下大模型向全社會開放。
從時間的粗線條上來看,從發布大模型到“開閘”,等待并不算久。
百度作為較早公布旗下大模型的公司,3月便發布了“文心一言”;4月,阿里“通義千問”開始邀請測試。此后,各家大模型也陸續“官宣”。
監管方面,我國首個針對生成式人工智能產業的規范性政策《生成式人工智能服務管理暫行辦法》已于8月15日正式施行。
圖片來源:工信部網站截圖
雖然各家大模型在介紹自身的產品特點上都各有側重,例如強調公司對人工智能長久以來的專注,或強調其在特定語境下的更優表現,再或者表達自身對行業難點的突破......但終歸目的只有一個,即在市場中率先“卡位”。
在此背景下,“應用”便成為了理解大模型的關鍵詞。
首先,我們將它作為一個動詞看,要想大模型解決實際問題,首先需要投入使用,也就是“如何應用”。
比如,9月7日發布的騰訊混元大模型,已經接入騰訊50多個業務,包括騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會議、騰訊文檔、微信搜一搜、QQ瀏覽器等。
“我們研發大模型的目標不是在評測上獲得高分,而是將技術應用到實際場景中。騰訊將全面擁抱大模型。”騰訊集團副總裁蔣杰說道。
圖片來源:騰訊全球數字生態大會公眾號
再者,我們也可以把應用看做一個名詞。面對形形色色的需求,大模型需要找到合適的路徑或載體。類比安卓或iOS這樣的操作系統,未來大模型的生態或許也將建立在無數的應用之上。
此前,我們在大模型“混戰”一文里有提到,如今的IT技術棧分為四層,芯片層、框架層、模型層和應用層。今天的ChatGPT、文心一言等屬于模型層,AI時代的原生應用都會基于大模型來開發。
業內一種觀點認為,如果說ChatGPT的出現是人工智能的“iPhone時刻”,GPT4插件功能的發布則讓人看到App Store(應用商店)的出現?;诖?,稱呼大模型為“輪子”也好,“底座”也好,無外乎不在突出其基石功能。
“模型本身是不直接產生價值的,基于基礎大模型開發出來的應用才是模型存在的意義,對于創業者來說,卷大模型沒有意義,卷應用機會更大。”9月5日,在2023百度云智大會上,百度創始人、董事長兼首席執行官李彥宏如是說。
圖片來源:百度公眾號
再進一步看,這背后更是一場“云計算之爭”。
即便是采用開源大模型,算力便是一頭不可繞開的“攔路虎”。此外,開源大模型的算法和數據亦有優化空間。因此,除了推出自研大模型之外,主要的云廠商在大模型服務方面亦在頻繁發力,MaaS(模型即服務,Model as a Service)成為新的商業模式。
生活、能源、金融、醫療、城市治理、科學研究……與更早之前火爆的元宇宙概念不同,伴隨著各種“型號”的大模型,典型的應用場景正來到我們身邊。
在公眾的視野當中,采用圖像大模型打造的產品是較早掙到錢的一批。
在這其中,閉源的Midjourney無疑是其中的佼佼者。不少報道都提及這家創立于2021年8月的公司,只有11名全職員工,不到一年便實現1000萬用戶和1億美元營收的壯舉。
據報道,目前Midjourney團隊成員已經擴大至40名,這些員工今年有望為Midjourney創造2億美元的營收。
另一方面,采用開源的Stable Diffusion,其部分產品也已實現商業閉環。典型的如7月推出的妙鴨相機,一段時間內幾乎橫掃社交媒體,不少用戶都紛紛上傳自己不同風格的“數字分身”。
據第一財經報道,妙鴨相機實際用到的技術并不復雜,應該是搭配了LoRA插件的Stable Diffusion開源模型。
圖片來源:妙鴨相機公眾號
在面向普通用戶的熱鬧之余,企業的自有場景也成為重點關注對象。
實際上,迅速瀏覽一遍各大云廠商的打法,這一“玄機”便不是秘密。換句話說,消費者可以通過語言類或視覺類產品來“玩”大模型,企業則需要大模型及其產品以實現“降本提質增效”。
這方面已有一批典型案例。在北京發布首批10個行業大模型典型應用案例中,基于電力行業NLP大模型的設備運檢知識助手示范應用、數字中醫大模型示范應用、面向建筑領域多模態行業大模型示范應用等案例,都展現出大模型與行業之間的融合可能性。
圖片來源:北京國際科技創新中心公眾號
實際上,在目前來看,大模型應用場景顯露的商機只可看作“小荷才露尖尖角”。
在上周才舉行的2023 INCLUSION·外灘大會上,專家普遍認為大模型產品的產業紅利才剛剛開始。
麥肯錫中國區主席、全球資深董事合伙人倪以理在現場預測,生成式AI的技術風暴有望開啟一場關系到未來8-10年的新一輪技術和產業變革。“AI對全球經濟的潛在收益將達到25萬億美元,是當前所有企業最重要的賽道之一,但這個時代剛剛開始。”
什么是“數據飛輪效應”?GPT4給出的精簡版回答是:
數據飛輪效應是一個概念,描述了數據、產品和用戶之間的正向反饋循環。初始階段,公司通過服務吸引用戶,這些用戶產生數據。隨著數據的積累,公司可以分析這些數據,優化其服務以更好地滿足用戶需求。優化后的服務吸引更多用戶,從而產生更多數據。這形成了一個正向循環:更多的用戶帶來更多的數據,而更多的數據又幫助公司進一步優化服務。
這也能解釋為什么包括GPT4在內的幾乎所有語言類大模型,都會在回復的同時提供反饋的按鈕。
圖片來源:新華社
宏觀層面上來講,在全世界范圍內的大模型大浪潮中,數據或將成為國產大模型的優勢。這一現象從移動互聯網時代產品上便可窺探一二。
據硅基研究室,國內大模型應用場景之所以與國外產生差異,本質上是在算力、算法不占優勢的背景下,加速“數據-模型-數據”的發展飛輪成型。也就是說,經過大量用戶使用后,這個飛輪得以不斷“轉”起來,大模型的不完美之處才有機會得以被彌補。
因此,對于大模型而言,高質量數據的重要性不言而喻。但這又將不可避免地涉及到隱私問題,以至于衍生到數據安全方面的問題。一個經常會被用使用的案例是醫療行業,不僅由于其專業性強,而且還在于其數據尤為敏感,比如會涉及到患者病情等大量個人信息。
回歸到大模型本身,要產生數據飛輪效應,意味著要有用戶使用。這也一定程度上回答了為何國內大模型要爭先上馬,打響字面意義上的“百模大戰”。
據中國經濟網從賽迪方面獲得的一份數據顯示,今年1-7月國內共發布了64個大模型。截至2023年7月,中國累計已經有130個大模型問世。
圖片來源:中國經濟網 數據來源:賽迪顧問《IT 2023》
硝煙彌漫之際,正如如今的手機操作系統生態,業內人士在展望未來的大模型生態時也預計其數量將是“幾個”。
在接受騰訊科技的采訪時,智源研究院院長黃鐵軍表示,大模型是AI時代的基礎設施,未來全球大模型的生態不會超過三個,而身處中間層的企業可以早點開始在應用層找機會。
(文章內容僅供參考,不構成投資建議。投資者據此操作,風險自擔。)
本文作者系天府文創云記者石普寧,轉載合作相關可搜索“天府文創云”公眾號。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP