每日經濟新聞 2024-06-07 18:27:28
每經編輯 張錦河
開欄語:《AIGC行業周報》梳理AIGC行業一周內發生的重要動態,產品發布和業內大咖的最新觀點。
圖片來源:每經制圖
(一)OpenAI公開前沿大模型安全策略細節
6月6日凌晨,OpenAI首次系統性地公開了其前沿大模型的安全策略,包括基礎架構、保護措施、敏感數據存儲和開發人員訪問管理等高級細節。這些信息不僅展示了OpenAI模型的開發流程,也為開發者研究前沿大模型提供了技術參考。同時,OpenAI近期頻繁發布關于AI模型安全的介紹,反映出其面臨的安全壓力。此外,11名OpenAI的現役和前員工發布了公開信,警告前沿AI模型可能帶來的風險,并呼吁制定安全、可持續的監督條例和規則。
(二)斯坦福Llama3-V項目被指抄襲清華MiniCPM-Llama3-V 2.5,引發開源社區質疑
近日,斯坦福大學的研究團隊發布了Llama3-V項目,宣稱僅需500美元就能訓練出一個與GPT4-V等性能相當的多模態模型。然而,項目很快受到社區的質疑,被指控抄襲了清華大學與面壁智能合作開發的MiniCPM-Llama3-V 2.5模型。面對抄襲指控,Llama3-V的GitHub倉庫和HuggingFace頁面被刪除,作者之一也對使用MiniCPM-Llama3-V 2.5的tokenizer進行了回應,但社區成員通過對比分析發現了更多代碼和架構上的相似之處,指出Llama3-V作者可能并不完全理解自己所使用的代碼。盡管Llama3-V項目試圖通過刪除項目頁面來應對質疑,但社區成員已經保存了相關證據,并呼吁斯坦福大學介入調查這一可能的學術不端行為。
(三)OpenAI和Google員工聯名警告AI風險,獲“深度學習之父”支持
近日,來自OpenAI和Google DeepMind的數名現任和前任員工發表了一封公開信,警告人工智能發展可能帶來的風險,包括社會不平等加劇、錯誤信息傳播和自主AI系統失控等。公開信強調,盡管全球政府和AI專家已意識到這些風險,但追求財務利益的AI公司往往抵制有效監督,現有企業治理結構不足以應對挑戰。信中呼吁AI企業遵循不簽訂禁止負面評價的協議、建立匿名反饋機制等原則。這封公開信得到了“AI教父”Geoffrey Hinton、圖靈獎得主Yoshua Bengio以及AI安全領域頂級學者Stuart Russell的支持。
(一)英偉達發布Blackwell GPU,推進AI帝國建設并解決全球耗電難題
6月3日凌晨,英偉達CEO黃仁勛(老黃)宣布了一系列技術創新和產品迭代,包括已經量產的Blackwell GPU,這款迄今為止最大的芯片將在未來8年內將1.8萬億參數GPT-4的訓練能耗降低至原來的1/350。Blackwell GPU的推出,連同其后三代的路線圖,標志著英偉達在AI領域的雄心和實力。黃仁勛還展示了英偉達在加速計算、AI工廠、數字人、智能體等領域的進展,并預告了下一代芯片Rubin。此外,英偉達還發布了數字孿生地球「Earth-2」項目,旨在通過高解析度的模擬預測全球氣候變化,推動物理AI和具身AI的發展,為未來的AI機器人時代鋪路。
(二)國產AI視頻生成模型「可靈」開放測試,展現高真實度和物理規律模擬能力
近日,快手推出了名為「可靈」的國產AI視頻生成大模型,該模型基于Sora技術路線并結合自研創新,能夠生成長達2分鐘、1080p分辨率的超長視頻??伸`不僅在運動模擬上表現出色,還能準確刻畫復雜運動并符合物理規律,如重力和光學反射。此外,它還支持自由寬高比,與快手的短視頻生態高度匹配。目前,可靈已在快影APP中開放測試,標志著快手在短視頻領域的AI應用邁出了重要一步。
(三)Meta AI模型NLLB200在Nature發表,翻譯質量提升44%
6月6日,Meta公司在《自然》雜志上發表了關于其最新AI模型No Language Left Behind (NLLB)的研究文章,該模型能夠支持200種語言之間的高質量翻譯,特別強調了對低資源語言的翻譯能力。NLLB-200模型通過采用稀疏門控專家混合架構,實現了高效的參數利用和計算資源分配,顯著提升了翻譯質量,平均翻譯質量提升了44%。此外,NLLB項目還包括了數據挖掘與預處理的創新方法,多語言訓練策略,以及綜合評估工具的開發,確保翻譯結果的安全性和可靠性。
(四)Stable Diffusion 3 Medium模型將于6月12日開源,優化多方面性能
6月3日晚,Stability AI的聯合首席執行官Christian Laforte在AMD產品發布會上宣布,備受期待的文本到圖像生成模型Stable Diffusion 3的Medium版本,具有20億參數,將在6月12日通過Hugging Face平臺開源。該模型在照片真實感、樣式、圖片質量以及資源消耗等方面進行了顯著優化,提供了與閉源產品Midjourney、DALL·E 3相媲美的性能。盡管之前Stability AI經歷了管理層變動和財務危機,但公司不僅穩定了局面,還可能獲得了AMD的贊助。Stable Diffusion 3采用了Diffusion Transformer架構,有效提升了文本語義理解、文字嵌入和圖像樣式的表現,目前該模型限于學術研究使用,商業化使用需聯系Stability AI。
(五)昆侖萬維開源2000億參數稀疏大模型Skywork-MoE,支持單GPU推理
6月3日,昆侖萬維公司宣布開源其2000億參數的稀疏大模型Skywork-MoE,該模型在保持高性能的同時大幅降低了推理成本。Skywork-MoE是基于之前開源的Skywork-13B模型擴展而來,是首個完整應用MoE Upcycling技術并落地的千億級MoE大模型,也是首個支持使用單個4090 GPU進行推理的開源模型。模型權重、技術報告完全開源,免費商用,無需申請。Skywork-MoE在8x4090服務器上通過FP8量化和非均勻Tensor Parallel并行推理方式,能夠達到2200 tokens/s的吞吐量。該模型還引入了Gating Logits歸一化操作和自適應的Aux Loss訓練優化算法,提升了模型性能和泛化水平。此外,Skywork-MoE展示了在不同訓練階段如何通過調整auxiliary loss系數來控制Drop Token Rate,以及如何通過Expert Data Parallel和非均勻切分流水并行技術提高大規模分布式訓練的效率。
(六)智譜AI發布開源GLM-4系列大模型,引領MaaS平臺升級與行業生態發展
6月5日,智譜AI在其開放日上宣布了GLM-4系列大模型的最新開源版本,包括性能超越Llama 3 8B的GLM-4-9B和多模態能力比肩GPT-4V的GLM-4V-9B,同時大幅降低了大模型服務的成本,以6分錢/100萬Token的價格提供服務。智譜AI的MaaS(Model as a Service)平臺升級至2.0版本,提供更高效的模型微調平臺和簡化的私有模型部署流程。公司CEO張鵬強調了通過技術創新實現應用成本降低和客戶價值提升的商業策略,并展示了智譜AI在大模型技術、生態建設和AI安全標準制定方面的領導地位。此外,智譜AI的開源模型累計下載量達到1600萬次,顯示了其在AI技術領域的廣泛影響力。
(一)英偉達Jim Fan認為具身智能的關鍵在于開發「Foundation Agent」
近日,英偉達高級研究科學家Jim Fan在GenAI峰會上探討了具身智能的挑戰與發展,認為難點不在于硬件,而在于開發「Foundation Agent」——一種能夠實現具身性、現實交互和技能掌握的通用算法。他分享了英偉達在Minecraft AI研究、Metamorph多形態機器人控制、Eureka自動獎勵函數設計等方面的最新進展,并強調了域隨機化技術在將模擬環境訓練的模型泛化到現實世界中的應用。Jim Fan預測,隨著技術進步,仿人機器人的成本將大幅下降,而人工智能的發展將是推動具身智能發展的關鍵因素。
(二)報告:生成式AI應用激增,亞太成增長最快區域
近日,全球咨詢公司麥肯錫發布的最新調查報告指出,生成式AI技術如ChatGPT和Copilot等的應用在2024年顯著增長,65%的受訪管理者已經在業務中使用該技術,相比2023年的33%幾乎增長了兩倍。報告特別強調,亞太地區是應用生成式AI增長最快的區域,這主要得益于技術環境和原生數字人口的優勢。應用場景主要集中在營銷銷售、產品服務開發以及IT領域。企業采用生成式AI的方式多樣,包括使用現成產品、合作微調模型和自主開發。麥肯錫認為,2024年是生成式AI實現場景化落地并產生商業價值的一年。
來源:每經科技提供
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP