每日經濟新聞 2025-01-01 22:34:31
每經記者 孔澤思 每經編輯 陳夢妤
近兩年,隨著新一代人工智能出世,以及資本市場加強對未來產業的投入,人形機器人開始逐漸從科幻走向現實。從資本市場近期表現看,人形機器人概念持續火熱,部分公司漲停連板?;ㄆ旆治鰩熤赋?,預計未來25年,人形機器人市場規模將達到驚人的7萬億美元。
與此同時,人形機器人部分產品也已開始出售交付,大有批量“進廠打工”趨勢。如2024年5月,特斯拉研發的二代Optimus人形機器人已進廠實訓,計劃2025年年底前量產銷售。在國內,如宇樹科技、達闥科技等廠商均已在人形機器人領域有所布局。
除了工業領域,人形機器人離我們的生活還有多遙遠,何時能“飛入尋常百姓家”?當前行業發展難點又有哪些?
近日,杭州宇樹科技有限公司創始人兼CEO王興興接受了《每日經濟新聞》記者(以下簡稱NBD)采訪。
5年內將有終端產品
NBD:2023年,國內很多人形機器人開始“進廠打工”,您怎么看這個現象?宇樹人形機器人的落地現狀和未來規劃是怎樣的?
王興興:我覺得這是一個趨勢。我們過去幾個月與蔚來的汽車工廠有合作,就現場部署了人形機器人做搬運。這個領域目前基本處于試點階段,大家覺得這個方向有價值,就共同推進落地部署,不過目前還沒有到真正的商業閉環階段。
我們公司主要是賣本體,如果是做科研教育、AI公司或者個人買來玩,我們完全歡迎。
此外,工業領域也在推進,比如我們希望去工廠幫忙做一些簡單的生產裝配,或者一些簡單的搬運工作,蔚來汽車工廠就是典型例子。我們其實沒有給自己定目標或者逼迫那么緊,還是尊重整個市場的反應,等技術、產品和大家接觸到一定程度,已經展現出更好的商業勢頭了,我們再大規模去推廣。
NBD:在人形機器人技術迅速發展的當下,面臨的最大瓶頸是什么?目前人形機器人應用領域中,哪些方面有可能實現突破性進展?
王興興:當下的最大瓶頸,包括人形機器人、四足機器人等,是基層AI在全球范圍內都沒有達到一個像初代GPT或者初代通用AI的能力,這也是目前整個行業最大的問題。
目前機器人本身,比如雙臂機器人或者工業機器人,如果加了AI以后產生的能效比人低,如速度比較慢、精度比較差、能干的活比較少,其實很難替代人在工業領域的價值,整個商業閉環沒法跑通。如果機器人AI的能力能突破一個臨界點,使得工廠的基本工序能夠高效運轉,同時成本也相對較低,那么就可以實現商業閉環并大規模推廣,我認為這將是非常有價值的。
當然,目前硬件方面也存在一些挑戰,例如機械臂的負載能力不足、精度不夠以及成本較高,但這些都屬于工程技術層面的問題。所以,最大的問題還是整個機器人AI沒有突破一個臨界點,目前在具身智能或者機器人AI這個領域,當下大家還覺得機器人有點笨拙,只能干一些固定的活,但我個人比較樂觀。再過三四年,不會超過五年,比如在工業或服務業,能有終端產品出現。
機器人需要更高級功能
NBD:近期人形機器人火熱至極,但公司早期也不看好人形機器人,請問宇樹是怎樣調整發展戰略的?
王興興:2020年以前就有很多投資人問我,你們做不做人形機器人,我非常斬釘截鐵地說不做,但為什么2023年初又開始做人形機器人了?其實最早在2009年和2010年,我自己做過小的仿生人形機器人,當時遠沒有達到我的預期,最大原因是當時全球人形機器人的控制技術不是特別理想,性能上不去,沒辦法看到實用價值,當時我就堅持不做人形機器人。
到了2021年、2022年,全球科技對人形機器人非常關注,并且在2022年底大語言模型出來以后,AI技術產生了質變,已經看到AI賦能機器人帶來的潛力。大家可能想象不到,2022年底,我們還沒做人形機器人,但已經有一些客戶找上我們想買人形機器人。我覺得社會的共識、熱度,客戶對它的期待程度,已經足夠了,所以我們2023年開始正式做人形機器人。
我們一直希望公司的商業化進程能夠保持積極正向,確保我們的產品受到市場的歡迎和社會的認可。當年選擇做四足機器人,是因為行業已經初現端倪,而現在選擇進軍人形機器人領域也是基于相似的市場洞察。
NBD:從目前人形機器人的研發來看,大模型可重點解決哪些技術問題?主要應用在哪些方向?大模型和人工智能的應用有望降低研發成本嗎?
王興興:目前大家說大模型,一般在說大語言模型或者多模態模型,實際上這部分是可以給機器人用的,2023年我們就結合了OpenAI的大語言模型接口,但實際上大語言模型本身是機器人模型的一部分,并不是全部。
比如跟機器人溝通的時候,肯定需要語言部分,但實際上我個人認為機器人的AI模型,本質上和語言模型還是有很大區別。舉個最直觀的例子,在工廠里工作的機器人,其實并不需要具備語音功能。只要它能夠完成任務,進行工作就足夠了。
機器人具身智能的核心在于其執行任務的能力,而不僅僅是對話。手機已經可以完成簡單的對話任務,因此機器人需要更高級的功能。然而,這部分的訓練其實與大語言模型關系不大,更多地依賴于模仿學習。此外,該模型的結構與大語言模型的結構也存在較大差異。這是目前大家已經看到的方向了,但是整個體系沒有大語言模型那么成熟。
在機器人具身智能領域,每家公司的想法都不太一樣,技術路線和共性都不太一樣,這就導致了其實很難評價發展路徑,是正確還是錯誤。舉個最簡單的例子,在大語言模型圈,ChatGPT模型出來以前,就有非常多語言模型結構,但大家現在已經忘了,因為發現GPT模型的架構更有價值?,F在人形機器人具生智能有點像ChatGPT出來的前一兩年,大家已經發現了這個方向,要往這個方向做,但還沒有哪家敢說自己的方向絕對正確。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP