每日經濟新聞 2023-09-12 16:30:51
“我覺得成都的人工智能發展還是不錯的,但是大模型相關的研究相對落后。我們好像一下子想不出有支團隊在做大模型,這是一個短板,所以成都應該著重考慮這個問題。”孫茂松認為,成都應該主打模型,特別是大模型在垂直領域的應用,通過應用要培育一支有這種能力的科研隊伍。
每經記者 淡忠奎 每經編輯 楊歡
歐洲人文和自然科學院外籍院士,清華大學人工智能研究院長聘教授、常務副院長孫茂松 圖片來源:每經記者 淡忠奎 攝
“大模型已經成為目前人工智能巔峰對決的一個終極戰場,如果我們沒有能力去參與,這肯定是一個短板,對成都的人工智能產業發展會帶來不利影響。”9月11日,第二十一屆中國西部海外高新科技人才洽談會開幕式暨天府論壇上,歐洲人文和自然科學院外籍院士,清華大學人工智能研究院長聘教授、常務副院長孫茂松分享了對ChatGPT為代表的生成式人工智能的最新觀察和思考。
今年5月發布的《中國人工智能大模型地圖研究報告》顯示,我國已有79個10億級以上參數規模的大模型,被外界稱作進入“百模大戰”時代。不論是人工智能企業,還是地方政府,都紛紛入局“新賽道”。
那么,現階段大模型的發展邏輯是怎樣的,如何才能讓它“說真話”?“百模大戰”時代,國內大模型企業如何才能制勝未來?像成都這樣布局較晚的城市,又該如何加速塑造自己的競爭優勢?孫茂松在論壇期間,接受了《每日經濟新聞》記者采訪。
“以ChatGPT為代表的生成式人工智能,這一年來火爆全球。但它的算法其實非常簡單,就是一個策略——下一個詞預測(自監督學習)。”孫茂松舉出一個例子,就像“我昨天晚上吃了飯”這句話,可以讓機器在任何一個位置停下來,比如,“我今天吃了—”,讓機器預測下一個詞。
人共享智能算法就會調動它內在的機制,讓機器去確定應該就是“飯”,這個策略就叫自監督學習。機器可以在互聯網上任意規模的語料上做這件事,進而覆蓋整個互聯網。在這種條件下,你給出一個上文“我昨天吃了”,它就會給出下一個詞的概率分布——
比如,“吃飯”概率是4.5%,“餃子”概率是3.5%,“桌子”的概率很低,但也不至于是0,“因為有寓言說大象可能吃了桌子”。倘若上文換成“我昨天晚上吃了北京”,可能35%的概率是“北京烤鴨”。
孫茂松認為,方法看似簡單,但要做到準確的估計非常難。就像我們平常去擲骰子,必須擲足夠多的次數才能確定骰子每個面出現的概率。這里涉及兩個關鍵因素,一個是骰子有6個面,但是我們詞語有五六萬個,也就是五六萬面。更麻煩的是,上文是無限的,所以它的面實際上是兩個因素相乘,“就是五六萬個詞,再加上幾乎無限數量的上文”。
這就要依靠“三駕馬車”——大模型+大數據+大算力。與此同時,AIGC(人工智能生成內容)的特點就是強大的內容生產能力,以及天馬行空般的創造性。假設句子中每個位置平均有100種“合理”的字接續,則可能形成“比較通順”的五律數量約為10^80個。
憑借強大的內容生成能力和創造性,生成式AI能夠有力助推數字經濟的發展,甚至可能帶來產業生態的重新洗牌。比如,在內容輔助生產方面,生成式AI從商業應用到文化創意產業的應用,能夠顯著降低制作成本、準入門檻,顯著提升生產效率、產品質量;芯片設計領域,生成式AI的使用能夠強化學習優化半導體芯片設計(布圖規劃)中的元件位置,將產品開發周期從幾周(使用人類專家)縮短到幾小時。
這正是生成式AI賦能千行百業的縮影。
8月31日,首批通過《生成式人工智能服務管理暫行辦法》備案的大模型百度文心一言、百川智能、商湯商量SenseChat宣布面向全社會開放服務。在商用之外,大模型面向普通人開放被視作人工智能產業的一個里程碑。
這不僅是面向普通人開放賦能工具、生活助手,更是意味著大模型將獲得龐大規模的中文語料投喂和更豐富的原生應用場景。“大模型有點像水電,它是一種智能信息處理的一個基礎設施,現在只要垂直領域需要用到信息處理,只要是數字化高度發達的應用場景,它就有可能(發揮作用)”。
就像是一個通用的底座,孫茂松告訴《每日經濟新聞》記者,就像你要蓋房子,它實際上是一個地基,可以在上面蓋各種各樣的房子。以前,相當于每個應用都要打一個自己的地基,蓋一個小房子,“現在是搞了一個特別大的地基,你就只需要考慮房子怎么蓋。”
這也給大模型的發展帶來新的想象空間。根據IDC預測,2026年我國AI市場規模有望達264.4億美元,2023-2026年CAGR約21.5%。而被比喻為目前階段“A終極戰場”之一的大模型,更是其中的引領性力量。
中信證券研報稱,大模型是連接底層算力和上層應用的重要一環,成熟的大模型能力和生態是真正的實現涌現人工智能和未來應用端繁榮的基礎,擁有更強計算和推理能力、更高通用性的大模型企業有望把握AI時代的流量入口和話語權。
從國內來看,大模型已經是人工智能企業的必爭之地,“百模大戰”漸成趨勢。不過,孫茂松認為,“百模”也不一定多。這些大模型可以分為兩類,一類是真正有實力做底座的,另一類實際上是拿別人開源的大模型去做應用訓練,“這兩塊的‘質’是不一樣的,真正有實力能和國際上PK的可能一個都沒有。”
他指出,很多大模型企業都會轉到垂直應用,甚至可能進入的時候就沒準備要做底座,而是要做垂直領域應用,“如果進入聚焦做垂直應用,還是值的鼓勵的。”大模型歸根究底要落地于具體的行業應用,細分領域還有更多機會。
“我覺得成都的人工智能發展還是不錯的,但是大模型相關的研究相對落后。我們好像一下子想不出有支團隊在做大模型,這是一個短板,所以成都應該著重考慮這個問題。”孫茂松認為,成都應該主打模型,特別是大模型在垂直領域的應用,通過應用要培育一支有這種能力的科研隊伍。
這是他在天府論壇上給成都開出的一劑“藥引”。孫茂松告訴《每日經濟新聞》記者,現在國內基礎大模型主要在北京、上海、深圳等城市,要想現在來做已經有些晚。后發城市應該著重來做大模型在垂直領域的應用,這一塊四川和成都是有優勢的,“有很多獨特的應用場景,別的地方不一定有。”
換句話說,不論是AI企業,還是競逐大模型的城市,都應該重點把握垂直領域的機會。不久前,2023世界人工智能大會也傳遞出這樣的信號。多位人工智能專家告訴記者,大模型是AI爆發式成長的基石,要著重引導既有大模型技術與垂直領域經濟發展深度融合。
與此同時,上海市徐匯區副區長俞林偉亦指出,“全面推動生成式人工智能在醫療、金融、智能網聯汽車、社交等領域率先發力,所有的行業都值得用大模型再做一遍。”在這種背景下,大模型的“應用戰”成為城市無法缺席的一場角逐。
“現在大家都在爭大模型,我們如果沒有這方面人才,可能就會喪失一些發展機會,而且跟成都的城市地位是不符的。”孫茂松認為,這一塊的短板應該盡快補上,畢竟成都是有這個實力的,“成都要跟北京、上海去比,而不是跟中游城市比”。
在他看來,有些省份或城市培養不出這樣的人才,所以需要想方設法去引進人才。但成都不一樣,川大、電子科大等高校水平都很高,但是可能因為對相關領域的重視程度不夠高,做這方面研究的人相對較少。當地需要進一步提高對大模型相關研究和人才的重視程度。
“現在像美國那些最重要的幾個(大模型)公司,都還在致力于打地基,今年也已經開始努力建‘大房子’。但是這些小房子它還沒顧上,成都其實可以去做不同領域的‘小房子’。這要蓋好也是很有挑戰性的。”他說。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP