每日經濟新聞 2024-02-26 17:33:03
◎月之暗面認為,通往通用人工智能的發展中,長上下文(long-context)會是一個很重要的點。某種程度上看,所有問題都是上下文長度問題。
每經記者 陳婷 楊昕怡 每經編輯 劉雪梅
當OpenAI的文生視頻模型Sora給世界帶來新一波的沖擊時,國內對人工智能領域的投資熱情也再次被點燃。
2024開年,有市場消息稱,AI創業公司“月之暗面”已完成新一輪超10億美元融資,投資方包括紅杉中國、小紅書、阿里,老股東跟投。美團也曾參與了該公司上一輪融資。本輪融資后,月之暗面估值達25億美元。
若以10億美元的融資規模來計,該輪融資是自ChatGPT掀起人工智能熱潮后,國內AI大模型公司迄今獲得的單輪最大金額融資。
為什么月之暗面能成為一眾資方的追逐焦點?英諾天使基金合伙人王晟告訴《每日經濟新聞》記者,對于早期投資的AI項目,考察的核心因素主要還是團隊。
月之暗面方面在接受《每日經濟新聞》記者采訪時表示,目前團隊超80人,其中大部分是技術人員,“每個月都有在全球某個領域有著顯著影響力的人加入。”
“歷史上所有的架構演進本質上都是在提升有效的context length(文本長度)。”在產品方面,像創始人楊植麟在今年2月對媒體表述的這樣,月之暗面現已推出的產品Kimi智能助手正是以領先的長文本處理能力受到了外界和資本的關注。未來,月之暗面還想在大模型領域做出To C的超級應用。
很難想象,作為國內AI領域最大單筆融資的獲得者,這家創業公司還未滿一周歲。
2023年3月1日,年輕的“天才AI科學家”楊植麟創辦了他的第二家AI公司月之暗面。和這家明星創業公司一樣,楊植麟有著似乎和年紀不太匹配的學術成就和創業經歷。
2015年從清華計算機系畢業后,楊植麟前往美國卡內基-梅隆大學攻讀博士,師從蘋果AI研究負責人Ruslan Salakhutdinov和谷歌首席科學家William Cohen,并與多位圖靈獎得主合作發表論文。
月之暗面向《每日經濟新聞》記者介紹,楊植麟是Transformer-XL與XLNet兩篇重要論文的第一作者,兩者均為大語言模型領域的核心技術。同時,他也是中國35歲以下NLP(自然語言處理)領域引用最高的研究者。
記者從業內人士處了解到,2016年,楊植麟曾參與創立循環智能(Recurrent AI),2021年12月,循環智能宣布完成由博裕投資和紅杉中國聯合領投的3800萬美元新一輪融資,老股東金沙江創投、靖亞資本、真格基金、萬物資本等跟投。報道顯示,循環智能的技術團隊曾與華為云聯合發布了國內首個千億中文語言模型“盤古NLP大模型”。
此外,月之暗面的兩位聯合創始人周昕宇和吳育昕,也均出身清華,擁有Meta、曠視科技等知名科技公司的工作經驗。
關于現有團隊規模,月之暗面方面表示,目前團隊超80人,其中大部分是技術人員,囊括了NLP、CV(計算機視覺)、RL(強化學習)、Infra(基礎架構)方面的新生代人才,“每個月都有在全球某個領域有著顯著影響力的人加入。”
英諾天使基金合伙人王晟在接受《每日經濟新聞》記者采訪時表示,對于早期投資的AI項目,考察的核心因素是團隊,“我們對項目的收入、利潤沒有什么要求,最重要的本質還是人。”
考慮到月之暗面的核心成員參與過Google Gemini、Google Bard、盤古NLP、悟道等多個大模型的研發項目,它成為資本的爭搶對象也不奇怪了。
有大模型創業公司CTO對《每日經濟新聞》記者表示,早在楊植麟創立循環智能和研發華為盤古模型的時候,便對其團隊有所關注。
企查查顯示,月之暗面在2023年6月首獲超2億美元融資,投資機構包括真格基金和紅杉中國,彼時估值3億美元。8個月后,月之暗面斬獲超10億美元融資,估值躍至25億美元。
除了“頂配”的創業團隊,月之暗面也交出了外界看來還算出色的研發答卷。
2023年10月,月之暗面推出了首款大模型產品Kimi智能助手。月之暗面方面介紹,與其他大模型產品相比,該產品的主要技術優勢在于超長的無損上下文處理能力和卓越的指令遵循能力。
據了解,Kimi智能助手支持輸入20萬漢字,按OpenAI的計算標準約為40萬token(模型可以理解和生成的最小意義單位),是彼時全球大模型產品中所能支持的最長上下文輸入長度。同期大模型Claude支持的最大長文本為10萬token。
“在投資機構和大廠的內部綜合評測中,Kimi智能助手的中文實力直追OpenAI,在理解和生成中文內容方面表現出色。”月之暗面方面向記者強調了該產品的中文處理能力優勢。
“AI產品榜(aicpb.com)”統計的數據顯示,Kimi智能助手在2024年1月的訪問量達142萬,在大模型創業公司的“AI ChatBots”產品中居于首位,月環比增長率為94.1%,增長速度也在大模型創業公司中排名第一。
另外值得關注的是,不同于市面上大多數大模型公司選擇做B端產品,Kimi智能助手的定位關鍵詞之一是“to C”。
楊植麟曾向媒體表示,AI Native的產品會在to C領域產生新的流量入口,成為AI時代的超級App,“這是一個非常大的機會”,他說,“To C就是一個自然而然的選擇”。
為什么選擇做To C領域,月之暗面向《每日經濟新聞》記者解釋,因為模型的能力還在快速迭代中,國內市場的B端產品往往需要私有化部署和定制化開發,而基于現有模型的某個版本做私有化部署和定制化的開發,將會導致B端產品的能力和用戶體驗完全跟不上模型能力的快速提升,很快就會被淘汰,最終浪費大量的人力、物力和財力資源。
王晟也對《每日經濟新聞》記者表示,投資人去年都在投資算力、芯片等基礎設施,今年會更關注AI能力的大幅度增長和成本的下降,應用端也會有機會開始出現,尤其是Agent(智能體),“因為Agent是和過去移動互聯網完全不一樣的東西,大家會率先開始在Agent中找相關的應用落地。”
同時,To C領域也是一眾互聯網大廠的AI探索方向。
AI與電商的結合是阿里巴巴當前的加碼重點。記者了解到,2024年起,淘寶天貓將全量向商家陸續發布十款智能工具和服務。淘寶還發布了“AI生態伙伴計劃2.0”,提供1億元計算資源補貼、接口費用減免以及免傭等激勵政策,進一步豐富并擴大AI開放生態。
此外,阿里云目前已在IaaS+PaaS層形成完善的AI基礎設施,有觀點認為,阿里云已經立志從為大模型提供云計算能力中找到機會。
而據去年5月消息,小紅書從該年3月份起籌備了獨立的大模型團隊,核心員工來自廣告業務的NLP技術團隊。然而,小紅書在大模型上并沒有明確進度,只在電商業務上加快步伐。不過,去年底,小紅書在主APP中內測了一個名為“Davinic”(達芬奇)的AI聊天功能。
去年12月,小紅書COO柯南在一次媒體對話中提到,去年比較意外的一個發現就是搜索價值,大量的新用戶因為搜索而進入小紅書。她表示,接下來,如何用AI更好地驅動搜索非常重要。
技術的突破造就了ChatGPT的一炮而紅,對于以技術為主打的創業公司而言,技術始終是其能否保持長期領先優勢的關鍵。
長文本,是月之暗面選擇的突破方向。
楊植麟在2023年11月的一次外部演講中認為,如今基于Transformer架構的大模型,是“新時代的計算機”,參數數量決定計算復雜度,上下文長度決定內存大小——因此,上下文長度是毫無疑問的關鍵所在。
他認為,規?;峭ㄏ駻GI的核心,而隨著模型不斷迭代,長文本會逐漸取代微調,成為定制模型的關鍵技術。
月之暗面也對《每日經濟新聞》記者表示,通往通用人工智能(AGI)(的發展中),長上下文(long-context)會是一個很重要的點。在其看來,某種程度上看,所有問題都是上下文長度問題。
那么,Kimi智能助手支持20萬漢字的長文本輸入,主打無損記憶。這一突破究竟有多難?
上述大模型創業公司CTO對記者表示,月之暗面對文本長度的突破有一定難度,但途徑也有多種,較成熟的有位置編碼的外拓,或者工程上的切片召回策略等。他表示,具體到月之暗面,由于沒有披露這塊細節,暫時無法得知其實現方法。
北京市社會科學院管理研究所副研究員王鵬對《每日經濟新聞》記者表示,支持超過20萬字的長文本輸入在技術上確實是一個挑戰,但是否算作重大突破,要取決于具體應用場景。
他提到,例如,在處理長篇小說、歷史文檔或復雜的法律文件時,能夠處理如此長的文本輸入將大大提高AI的理解和分析能力。
“這要求模型不僅要有強大的計算能力,還需要有優秀的內存管理能力來保持對長文本的連貫理解。”王鵬說。
深度科技研究院院長張孝榮對《每日經濟新聞》記者表示,支持超過20萬字的長文本輸入確實可以算是一個技術上的突破。在自然語言處理領域,處理長文本一直是一個挑戰,長文本需要大模型有更強的“記憶”能力。當大模型有了這種長文本能力,才能更方便地處理小說、財報等。
張孝榮告訴記者,大模型能夠處理長文本輸入,可以帶來多方面的影響。首先,這可以提高自然語言處理的準確性和效率,使得模型能夠更好地理解和生成自然語言文本。其次,這也為一些需要處理大量文本數據的任務提供了可能,比如文獻分析、文本挖掘等。
此外,長文本處理技術的發展,還可以推動自然語言處理在其他領域的應用,比如更加真實的智能客服、通過多篇財報進行市場分析、處理超長法務合同文本、基于長篇小說進行角色扮演等。
當創業公司以技術馳名,注定著它需要面對保持技術領先性的壓力。與此同時,好技術如何變成好生意,同樣是一個需要在探索中回答的難題。對于月之暗面而言,完成迅速崛起不過是萬里跋涉第一步。
在演講中,楊植麟曾表示,“爬樓梯”是月之暗面真正想做的事情。
他發現,做大模型的主要是兩種人,一種是看風景的人,用AGI解鎖了很多可能性,另一種是勇攀高峰的人。
“勇攀高峰,其實是爬樓梯,但不代表說我們不看風景,而是說在你看風景的同時,你可能要花更多的精力,花更多的時間去以周為始的思考:到底月球的背面是什么?”楊植麟說。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP