每日經濟新聞 2024-03-19 19:23:47
◎瀾舟科技創始人兼CEO周明表示,數字化浪潮中,以大模型為代表的人工智能正在重塑人類的未來。2024年將是大模型落地元年,如何利用大模型技術助力企業成長已成為業界關注的焦點。
每經記者 趙雯琪 每經編輯 劉雪梅
經過了2023年的創業元年和百模大戰后,大模型新一輪的商業場景落地之戰已經打響。
3月18日,瀾舟科技發布“一橫N縱”孟子大模型系列及產品,包括Mengzi3-13B大模型、孟子金融大模型、孟子編程大模型,及應用能力型產品AI文檔理解、文檔問答、文檔輔助寫作、機器翻譯、瀾舟智會、AI搜索等。
就在同日,同樣是大模型明星公司月之暗面宣布在大模型長上下文窗口技術上取得新的突破,其自研的Kimi智能助手已支持200萬字超長無損上下文,并于當日開啟產品內測。
瀾舟科技創始人兼CEO周明在現場向包括《每日經濟新聞》記者在內的媒體表示,數字化浪潮中,以大模型為代表的人工智能正在重塑人類的未來。2024年將是大模型落地元年,如何利用大模型技術助力企業成長已成為業界關注的焦點。
“政府工作報告新鮮出爐,特別強調以人工智能+,驅動各行各業的轉型升級。作為賽道中的創業公司,要把握好這個歷史契機,通過落地,創造價值,拉動創新。”周明表示。
作為創新工場孵化的大模型創業公司,瀾舟科技同時宣布與李開復的零一萬物達成合作,李開復預測,3年之后,生成式AI的應用將成為用戶增長最快的應用,全移動時代的應用將會成為過去式。
“今天完成了瀾舟深耕大模型(含預訓練模型)三年來的成果匯報,謝謝大家支持!”在瀾舟科技的新品發布會結束后,周明在朋友圈這樣感嘆。
公開資料顯示,瀾舟科技于2021年6月正式成立,致力于自主研發大模型技術和行業應用,在去年3月發布了孟子GPT V1(MChat)大模型,今年1月孟子大模型GPT V2(含孟子大模型-標準、孟子大模型-輕量、孟子大模型-金融、孟子大模型-編碼)對公眾開放。
周明介紹稱,瀾舟團隊在近期完成了Mengzi3-13B的大模型訓練,在常見公開數據集,如MMLU(多語言理解均值),Chinese-MMLU(中文-多語言理解均值),GSM8K(評估大模型數學運算能力的數據集),HUMAN-EVAL(一個用于評估人工智能模型生成文本質量的指標)等評估模型效果來看,該模型在各項基準測試中與相仿參數量大模型相比,英文能力提高了6.7%,中文能力提高了9.1%,中英文語言能力成績領先,在編碼和數學等兩個方面也取得了上升的結果。3月30日Mengzi3-13B的模型將在GitHub(一個面向開源及私有軟件項目的托管平臺)、HuggingFace(一個人工智能社區)、魔搭和始智AI社區開源。
相比于通用大模型,瀾舟科技從創業第一天就聚焦于行業/垂直大模型。據周明介紹,瀾舟科技的體系為“一橫N縱”,即以孟子大模型為基礎,面向多個ToB場景發布垂直領域的產品。瀾舟科技目前重點投入到了金融行業,輔助編程等領域,希望打造更加貼近行業場景的垂直大模型。
其中,瀾舟科技的大模型產品包括AI文檔理解,該產品涵蓋專業的PDF文檔解析能力和信息抽取能力。在與新華智云共建文化大模型,以及其他眾多AI文檔理解,信息提取類客戶場景中均已使用。
除了文檔理解、搜索和問答,周明也介紹了瀾舟科技面向場景的可控AI寫作助手-AI文檔輔助寫作。該產品支持用戶上傳多個文檔作為參考資料,支持自定義多級題目和寫作提綱,由大模型賦能自動化按要求生成完整的文章初稿,目前已經在聯通客戶項目落地,為其數智化投研平臺提供了智能研報寫作的能力。
作為創新工場孵化的大模型創業公司,瀾舟科技與零一萬物也宣布達成合作。在去年的大模型創業浪潮中,李開復帶隊創辦了AI公司零一萬物,此前已推出Yi-34B和Yi-6B兩個開源大模型,號稱對學術研究完全開放,同步開放免費商用申請。
在李開復看來,瀾舟在基于大模型面向企業市場落地方面已經有了非常好的基礎,零一萬物在千億級大模型、多模態方面會投入更多力量,未來兩家創業公司能實現優勢互補。
李開復表示,大模型的智力水平在兩年前就已經比普通人水平“好一點”,目前,世界上最好的大模型已經是人類平均智力水平的3倍。李開復以“答題”舉例,即在100道考題里,普通人平均只能答對33題,而“最好的AI大模型”可答對99道以上。
他同時指出,AI 2.0模型能力突飛猛進,通識理解已經超越人類專家。AI 2.0通過圖靈測試并趨于成熟,揭示下一個平臺級變革。新一代創新應用需要新的技術平臺,基于強大的底層技術搭建出高效的開發工具,從而節約開發生態做創新產品的成本,促進包括新產品、新業態、新的商業模式的全新應用生態。
而對于AI 2.0未來的發展趨勢,李開復如此總結:
最革命性的AI 2.0應用應該是AI-First/AI-Native:最終脫穎而出的應用屬于那些敢于全力投入新技術的先驅者。大語言模型的引入為AI-First應用帶來了巨大的推動力。
現實世界的信息是文本、音頻、視覺、傳感器以及人類各種觸覺的綜合體系,要更為精準地模擬現實世界,就需要將各種模態能力打通,例如文本-圖像、文本-視頻等跨模態甚至全模態的綜合能力。
李開復表示,未來AI 2.0將超越對話,從聊天工具到智能生產力工具,在此趨勢下,用戶體驗以及未來交互界面和商業模式都會發生大的變革。除此之外,AI 2.0將走向實體,大幅提振社會生產力,具身智能可以讓機器人制造機器人,進一步實現AI 2.0+生產線智能規劃。
李開復發表《AI 2.0 平臺變革進行式》主題演講 圖片來源:每經記者 趙雯琪 攝
經過了過去一年的創業潮,大模型賽道神仙打架,頭部企業也密集發布產品,一直延續至今年。
但對每一家公司來說,商業化落地都并非易事。今年以來,大模型市場派代表人物朱嘯虎、周鴻祎接連向技術派“開火”,直言不看好通用大模型在國內的前景。
北京市海淀區副區長徐振濤提供的數據顯示,北京市僅海淀區大模型企業、機構超90家,并且數量持續增長。通過備案的大模型36家,占全市的72%以上,截止到目前已經培育20家獨角獸企業,占全市的60%,企業在人工智能領域,授權發明專利數量8.1萬件,占全市的62%。這也意味著,大模型賽道愈發擁擠,競爭也依然激烈。
在周明看來,經過一年的發展,大模型將在今年迎來落地元年,而談及如何做好大模型落地應用,周明表示,雷軍所說的互聯網七字法則“專注、極致、口碑和快”仍然適用,還要再加上“成本”,大模型創業不能不在意成本,一定要有造血的能力,形成大模型落地九字法則:“專注、極致、口碑、快、成本”。
針對大模型的行業落地適配問題,周明則提到了L1-L2-L3-L4的層次化分級服務體系,基于L1-通用大模型,在此基礎上加入行業數據訓練出L2-行業/垂直大模型,如金融、編程大模型。針對重要場景,在L1或者L2模型基礎上finetune(微調),實現L3大模型。最后Agents(代理人)可以調用L1-L2-L3任何一層的模型形成完整的一個特定任務。
中關村數智人工智能智能產業聯盟理事長崔寶秋則表示,大模型未來會觸及、波及到每個人,對于大模型創業公司來說,抓住剛需是第一步,其次要了解自己的技術邊界是什么,除此之外,大模型創業公司不要被大模型快速發展淹沒,在進行商業落地、實際運用的探索時要提前想清楚自己的優勢是什么。”崔寶秋表示。
“大模型創業所需要的生態環境非常重要,瀾舟一方面聚焦自己擅長的能力和場景,另外一方面會注重與開源社區、與客戶和合作伙伴攜手共進。”周明表示。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP