每日經濟新聞 2023-10-22 15:14:16
◎恒生電子首席科學家、大模型產品總監白碩說:“站在大模型的角度,所有的插件都是工具;站在我們的角度,這些都是我們大模型生態的一部分?!?/p>
每經記者 葉曉丹 每經編輯 張海妮
10月19日,恒生電子(600570.SH,股價29.92元,市值568.48億元)發布了金融大模型LightGPT最新的能力升級成果,以及基于LightGPT打造的多款光子系列大模型應用產品,并宣布正式開放產品公測。
恒生電子董事長劉曙峰表示,當前金融行業對于大模型技術的關注度和參與度很高,但在大模型實際落地過程中主要存在模型選擇難、算力供應不足、應用成熟度不足等問題,建議機構可以通過選擇合適的金融大模型,采用大模型“私有化+MaaS服務”混合部署,基于場景驅動的金融垂直應用開發和積累數據資產、構建數據飛輪、提升應用成熟度等工作,實現金融行業大模型更好的應用落地。
恒生電子首席科學家、大模型產品總監白碩介紹,此次升級的LightGPT,面向金融機構實現LightGPT-7B的開源,推理和訓練全面適配華為昇騰系列。
恒生電子推出金融大模型,背后經歷了怎樣的轉向?落地應用金融行業,金融大模型具備哪些共通性和特殊性?當前大模型所需的AI算力,在國際半導體行業政策風聲鶴唳之際,將面臨怎樣的連鎖反應?
在此次發布會之際,《每日經濟新聞》(以下簡稱NBD)記者專訪了恒生電子首席科學家、大模型產品總監白碩。
白碩 圖片來源:受訪對象供圖
NBD:最近大家關注度比較高的是美國半導體禁令,新規可能會沖擊英偉達A800或者H800的銷售,對國內AI芯片或帶來沖擊,怎么看這一禁令后續對大模型行業帶來的連鎖反應?
白碩:我理解這可能會帶來幾方面影響:第一,由于禁令的生效,國內大模型企業可能打算買的或者已經在路上的AI芯片,都可能存在一定的風險。買不到當然就是“無米之炊”,大模型企業想推廣的一些場景可能面臨不方便推廣或者沒有那么順利的問題。
挑戰也帶來了另一方面的影響:一方面,國產相應GPU可以快速頂上,達到同步、同功能、等效的替換。站在這個角度上,確實我們看到一些企業,譬如海光、華為的昇騰都在發力,我也期待他們會提供更加符合客戶要求的算力支持,我們也會一起幫助AI的應用真正在行業落地。所以從這一方面來看,其實它是一個機會,推動國產GPU的技術進步。
此外,未來還會不會有另外一種可能性,當前國內大模型已經有的算力,可能處于一種分散的狀態,不一定能夠發揮它最大的效能,已經有的算力掌握在少數單位或者少數機構的手里,并不能非常充分地發揮它的作用。我們有沒有可能把算力集中起來,以行業的方式,統一提供服務?這也是我們在思考的一條路徑。
NBD:目前國內有多家金融機構研發自己的大模型技術,但大模型的開發需要大量資金、算力和數據的支撐,也對研發企業的實力提出了挑戰,大模型技術未來是否會進一步拉大頭部和中小金融機構之間的技術差距?
白碩:如果從算力角度來看,不同規模金融機構在算力方面投入的差距,可能很大程度上會使這個差距加劇,對算力投入成本的承受程度各不相同。但是,如果可以通過行業能力統一的方式來提供算力服務,大家或許都有機會。
另一方面,實際上大模型的預訓練、精調和推理部署需要的算力有數量級的差別。實力雄厚的頭部企業研發投入充足,先發優勢明顯,可以利用相對大的算力和自有數據對大模型進行精調;而研發投入相對有限的中小機構,可以采用跟隨策略,直接使用成熟模型,只進行推理部署而不做精調。像恒生這樣的金融科技服務商,可以在打造成熟模型方面為市場提供相應服務。
NBD:恒生電子劉曙峰董事長提到了金融大模型的三個難點,模型選擇難、算力訓練難、質量控制難。目前大模型還面臨哪些挑戰?在語料大數據上,如何做好成本和質量上的平衡?此前,有數據行業人士提出一種方案:在相對垂直的領域,能不能通過提升語料的精度,優化大模型運行所需算力消耗?對此,您怎么看?
白碩:我覺得提升語料精度還不完全,這只是極小一部分。生態里有一些更合適的環節去承載精準的數據,而大模型只需要跟它對接,對接好了,質量自然就會提升。今天我們已經看到了在大模型上,無論是實時行情的插件還是精準規則的插件,都起到重要的作用。
還有一些數據是直接從應用系統里調出來的,這也是非常精準的,也是實時的。提升大模型整體表現,需要端到端地來看,讓合適的組件提供合適的服務,構筑全面的生態。
NBD:它又給大模型應用層帶來了很大的空間?
白碩:是的,可能很多通用領域的大模型供應商不會這么想,他們想的是怎么把別人的插件變成自己附屬的一部分。但恒生這次推出的“光子”,定位金融應用對接大模型的“中控”部位,串聯了通用工具鏈、金融插件工具、金融數據和金融業務場景,包括大模型也是它的一個組件,我們并不認為大模型就是核心。(備注:“光子”系恒生電子于今年6月推出的金融智能助手)
說到這里,這件事情怎么做更好,腦洞可以開得更大一點。推動大模型本身的技術進步和數據質量的提升只是一個手段,其他的手段還包括把更優質的數據放到更合適的部位,加強大模型跟其他組件的對接能力,而不是讓大模型無所不能,這樣才能構筑良好的大模型生態。
NBD:恒生推出的金融大模型LightGPT“私有化+MaaS服務”混合部署,提到了私有化數據私有化部署,共有數據公有云模式,私有云、混合云、公有云多種部署方式并存,這是基于金融行業的特色化布局?
白碩:不僅是金融行業,所有需要強監管、所有要求“家里有數”的機構都是一個道理,數據放出去,價值就不是你的了,只有在你手里,才是你的價值。如果這樣的數據不和大模型結合,可能挖掘不出比較深的價值。所以,“家里”的數據和大模型的語言能力,加上通用的能力完整地結合,并不是把所有的能力壓在一端,這個生態本身就是廣義的。
站在大模型的角度,所有的插件都是工具;站在我們的角度,這些都是我們大模型生態的一部分。
NBD:恒生在這個時點推出金融大模型,基于哪些方面的考慮?
白碩:首先,一直以來恒生不僅是資本市場傳統的IT系統供應商、金融數據提供商,也是資本市場重要的AI應用供應商。如智能客服、智能文檔、智能投研等智能應用,類似這樣的工作已經開展多年了,不是有大模型之后才入場的,我們原來就是這樣的技術廠商。
總體來說,恒生和恒生旗下金融數據服務子公司恒生聚源都是這個戰場上很長時間的一個玩家。即使人工智能在金融應用方面,也是一個很長時間的玩家。所以,我們知道這里面的行業痛點,也知道大模型技術出來以后,對我們意味著什么。
首先是在我們內部發生了一個轉向:從以前依靠小模型轉到依靠大模型,這個是最根本的。
傳統模型或者說“小模型”,采用的是AI模型框架,為這個模型提供專用的數據,甚至是標注數據,訓練出來是一個個“煙囪”。這些參數別的系統不能用,這些系統想要獲得AI的能力,還得再去做獨立的數據采集、數據標注和深度學習,這些是傳統行業的特征。
而AI大模型是大規模預訓練的,也就是說是大數據一次性灌到參數里,再經過一些精調,它可以同時適用于多個應用領域和多項AI任務。這些應用領域不需要再做大規模數據標注,只需要在任務精調環節做少量的數據標注,這是一個特別大的變化。
從傳統人工智能或者小模型,轉到現在的大模型,某種意義上相當于否定自己,我們有強烈的危機感,所以整個團隊內部的轉向是一個非常痛苦的過程。同時,這也意味著驅動我們轉型的動力非常足,干勁也非常高,團隊的共識也非常凝聚。
封面圖片來源:受訪對象供圖
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP