每日經濟新聞 2023-07-07 18:40:12
每經記者 王晶 每經編輯 梁梟
當前,國內大模型進展不斷。7月7日,在華為開發者大會2023(Cloud)上,華為常務董事、華為云CEO張平安發布了盤古大模型3.0。據他介紹,盤古大模型3.0是一個面向行業的大模型系列,包括“5+N+X”三層架構。
傳統的AI開發模式下,一個場景對應一個模型,數據質量差、樣本少,模型精度差,并且應用場景相對單一。不同行業、不同場景對AI的需求既復雜且碎片化,每個痛點都需要進行定制化地開發和改造;另一方面,AI算法從理論上能夠極大提升產品及服務的價值量,但由于開發過程中存在大量的碎片化因素,不同的應用場景往往需要獨立的架構設計與調參,效率相對較低。“小作坊式”的AI開發模式在一定程度上限制了生產力。
華為云CEO張平安 圖片來源:官方供圖
從華為盤古大模型的進化路徑可以看出,主要分為L0、L1、L2三個階段。L0指基礎大模型,L1是在L0基礎上導入行業數據進行訓練后衍生出的行業大模型,L2是在L1基礎上結合行業細分場景得到的推理模型,上層是在下層的基礎上演化而來,層層遞進。國金證券認為,華為盤古大模型是一種工業化AI開發的新模式,可以解決小模型的定制化難題,使一個模型應用到多個場景中。
具體來看,其中,L0層包括自然語言、視覺、多模態、預測、科學計算五個基礎大模型,包括NLP(自然語言處理)大模型的知識問答、文案生成、代碼生成,以及多模態大模型的圖像生成、圖像理解等能力。
L1層是指N個行業大模型,華為云既可以提供使用行業公開數據訓練的行業通用大模型,包括政務、金融、制造、礦山、氣象等大模型;也可以基于行業客戶的自有數據,在盤古大模型的L0和L1層上,為客戶訓練自己的專有大模型。L2層則提供面向各行業中更細化場景的模型,如先導藥物篩選、傳送帶異物檢測、臺風路徑預測等具體行業應用或特定業務場景等。
公開資料顯示,華為盤古大模型于2020年啟動研發。2021年4月,華為發布了NLP大模型、視覺大模型和科學計算大模型。此后,盤古大模型在性能、深度、架構方面及數據增強方面持續升級。當前,盤古大模型的核心定位是為各行各業賦能。
會上,張平安分別介紹了盤古大模型在金融、金融、制造、醫藥研發、煤礦、鐵路等諸多行業發揮的價值。
例如,在煤礦領域,盤古礦山大模型已經在全國8個礦井規模使用,一個大模型可以覆蓋煤礦的采、掘、機、運、通、洗選等業務流程下的1000多個細分場景,讓更多的煤礦工人能夠在地面上作業,減少安全事故;在氣象領域,原來預測一個臺風未來10天的路徑,需要在3000臺服務器的高性能計算機集群上花費5小時進行仿真。現在基于預訓練的盤古氣象大模型,10秒內就可以獲得更精確的預測結果。
張平安表示,華為的盤古大模型不會寫詩,只會做事。它要幫助各行各業,在各個領域都要讓AI來賦予它們價值。比如金融、礦山、政務,有很多工作小組都派下去。“我們一直堅持的方向就是‘AI for Industries’”
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP