每日經濟新聞 2023-05-13 15:42:24
每經記者 李孟林 蔡鼎 譚玉涵 每經編輯 高涵 譚玉涵 何小桃
5月11日,谷歌在今年的I/O開發者大會上一口氣發布新版PaLM 2、升級版辦公全家桶以及更加智能的Bard聊天機器人等多款AI產品。相比在2月的Bard翻車發布,這回似乎給自己挽回了一些顏面。但是否真的“一雪前恥”了呢?ChatGPT-4和PaLM 2,誰更強?《每日經濟新聞》深度評測并采訪西班牙游戲工程師、技術博客Orange’s AI主理人,給出你答案。
馬斯克曾表示,“一旦我找到一個足夠愚蠢的人來接手這份工作,我就會辭去推特CEO一職!”5月12日,馬斯克發布推文官宣NBCUniversal原全球廣告業務主管Linda Yaccarino將出任推特CEO。她有什么來頭?“一周人物”為你揭秘號稱廣告界“天鵝絨之錘”的Linda Yaccarino。
瑞信危機中,瑞士監管局將瑞信160億瑞郎AT1債券全額減計后,原本作為全球財富管理中心的瑞士信譽大幅受損,從而驅動避險資金從瑞士撤出,瘋狂涌入新加坡。
更多內容, 盡在《一周國際財經》。
對決GPT-4,谷歌推出PaLM 2,誰更強?
深度評測給你答案
圖片來源:谷歌I/O大會官方視頻截圖
當地時間5月10日,在一年一度的開發者大會上,谷歌連續放大招:推出最新大模型PaLM 2;官宣用生成式人工智能(AI)技術改造辦公軟件全家桶WorkSpace;升級后的聊天機器人 Bard向所有人開放。此外,多模態大模型Gemini正在緊鑼密鼓地訓練中,整合對話功能的谷歌搜索也將開啟測試……
在生成式AI浪潮中慢了微軟和OpenAI一步的谷歌,顯然把這一次大會變成了“秀AI肌肉”的舞臺。據美國媒體統計,兩個小時里,谷歌演講者提到了143次AI。
發布會上,谷歌DeepMind副總裁ZoubinGhahramani表示:“PaLM 2不只是功能更強大,它比以前的模型都更快速、高效?!?/span>
言語之間,GPT-4似乎是谷歌暗中較勁的對象。究竟PaLM 2和GPT-4(ChatGPT Plus試用版)相比表現如何?我們從文本生成、邏輯推理、數學能力、文本總結和編程能力五個方面做了深度測評。(注:由于Bard目前只支持英、韓、日三種語言,所以我們使用英文進行測試。)
資本市場的反響也很熱烈,谷歌股價連續兩天分別漲超4%。這一次,谷歌能否扳回一城?
編程、推理、造句…… PaLM 2仍有差距谷歌這次發布會,外界最關注的是其最新大模型PaLM 2,以及由該大模型驅動的升級版Bard。深耕AI多年的谷歌此前被OpenAI搶了風頭,有大模型加持的微軟也對谷歌的搜索霸主地位構成嚴峻威脅,因而本次發布會被視為谷歌的反擊戰。據谷歌介紹,PaLM 2的主要提升在于:
1. 多語言能力:由100多種語言材料訓練而成,理解、生成和翻譯細微文本的能力大幅提高。
2. 推理能力:PaLM 2的廣泛數據集包括包含了數學表達式的科學論文和網頁,其邏輯、常識推理和數學方面的能力提升。
3. 編程:PaLM 2 在大量公開可用的源代碼數據集上進行了預訓練,擅長主流的編程語言,如Python和JavaScript,也可以用Prolog,Fortran和Verilog等語言生成專門的代碼。
僅從文字描述來看,PaLM 2的性能似乎僅是在追趕和對齊GPT-4。不過,據谷歌官方發布的技術報告,在針對公開數學題數據集MATH、GSM8K和MGSM的訓練上,PaLM 2的部分結果已經做到了超越GPT-4。
真實表現如何?以下是我們進行的深度評測。
1. 文本生成
我們這里采用了AI工程師Daniel Monge發明的“蘋果測試”,即用英文單詞“apple”結尾造十個句子。據Monge,這個問題看起來簡單,但對于GPT和PaLM這樣的自回歸模型而言并不容易。
測試結果顯示,GPT-4完成了5個句子,而Bard一個句子也沒有完成。
2. 邏輯推理
“一磅的羽毛和一磅的鉛哪個更重?”是一個典型的腦筋急轉彎問題,因為人們容易把物體的密度和重量搞混。我們把測試稍作改變,改為“一磅的羽毛和兩磅的鉛哪個更重”,來增加迷惑性。
GPT-4正確回答了問題,而Bard完全忽視了問題中兩磅鉛的設定,仍然回答兩者一樣重,并且煞有介事地解釋為什么人們會認為一磅羽毛比一磅鉛更重的原因,因為一磅羽毛的體積更大,似乎相當得意于自己避開了“坑”。
3. 數學能力
我們從美國教育部門的數學題集中選擇了一道九年級難度的題目:求坐標軸中P(-2,7)和Q(8, 21)兩點的中間點坐標。
Bard給出的答案(3,14)是正確的,且給出了三種不太一樣的回答(雖然解法是一樣的)。
GPT-4支持的ChatGPT Plus同樣給出了正確答案。不過《每日經濟新聞》記者注意到,ChatGPT Plus的答案生成速度要慢于Bard。
4.文本總結
長文本總結是生成式AI最能幫助我們日常工作的功能。我們把《華爾街日報》一篇關于一名美聯儲官員支持繼續加息的文章(673個單詞)發給兩個模型,讓他們以少于100個單詞的長度總結大意。
兩個AI都總結出了新聞的大意,但GPT-4的內容納入了很多過于細節的信息,更像是原文的刪減拼接,而且單詞數超過了100,而Bard的答案更加精煉,有“總結感”。
5. 編程能力
再來看編程能力??萍疾┲鱀avid Gewirtz在四月測試過Bard和ChatGPT的編程能力,并在谷歌I/O大會后測試了最新版的Bard。他的測試一共有四個題目:用PHP語言為博客網站寫一個插件;修改代碼中的數字表達形式;修復編程錯誤(bug);用不同編程語言完成Hello World示例程序。
ChatGPT在四個任務上都成功了,而Bard在三個任務上都出了問題。以最后一個任務為例。David Gewirtz表示,ChatGPT通過了多種主流編程語言的測試,Bard只測試Python一個語言,其生成的代碼未能在循環(loop)里的數字后加上一個空格,但總體而言勉強可以運行。
“現在,我們某種程度上可以說Bard能寫代碼,但它的水平像是大學一年級的編程學生,成績可能是C,”David Gewirtz總結道。
西班牙游戲工程師Marko Bilal對《每日經濟新聞》記者表示,他還需要幾天時間的測試,才能對Bard和ChatGPT的編程能力做出充分對比。他目前唯一注意到的區別是,Bard能夠接受的輸入內容長度要短很多,而且答案只給出代碼中需要修改的地方,但ChatGPT每次都給出完整代碼。
小結Bard在編程、文本生成、邏輯推理上明顯弱于GPT-4,在數學計算上不相上下,而在文本總結上更勝一籌。從上述簡單測試而言,可以說Bard距離GPT-4還有一定差距。
AI產品經理、技術博客Orange’s AI主理人Leo對《每日經濟新聞》記者表示,PaLM 2的代碼能力只在最小參數的模型上做了優化,效果不盡如人意,和開源模型打平,但和GPT-4差距巨大。但他同時強調,這樣對比也不算公平,需要等PaLM 2的大號模型訓練好編程能力之后再做比較。
不過,和GPT-4相比,PaLM 2也有獨到的優勢。谷歌為PaLM 2提供了四種參數的模型,從小到大分別為“壁虎” (Gecko),“水獺”(Otter)、“野?!保˙ison)、“獨角獸”(Unicorn)。Leo認為,這種模式非常靈活,最小模型的速度非???,可以在手機本地運行,而GPT-4則是單一大模型,速度較慢。
“其實大部分任務小模型就已經足夠。PaLM 2最大參數的模型也比上一代小很多,這說明(谷歌)已經過了暴力增加參數的探索階段,進行了更科學的訓練,”Leo表示。
AI競爭有一定優勢,但谷歌仍需奮力追趕2023年2月,谷歌在ChatGPT的壓力之下匆忙上演Bard首秀,由于現場演示回答問題時“翻車”,當日股價大跌近8%。
本周,谷歌一口氣推出AI升級全家桶之后,股價連續兩日漲超4%,回升至2022年8月以來的高位,看來資本市場對谷歌的努力還是很認可,CEO皮查伊的焦慮應該稍微緩解一下了。
“隨著各個行業對AI應用的需求加速,我們認為谷歌在整個產品組合中提升和整合生成式AI是一個積極的信號,因為隨著今年新產品的不斷推出,AI大戰的關鍵就是看誰能爭奪更大的市場份額,”美國WedBush證券TMT組對《每日經濟新聞》記者表示。
WedBush認為,本周的谷歌開發者大會可以說是谷歌和微軟AI大戰的決定性時刻之一,兩家公司在云原生應用、硬件和對話式AI上開啟全面爭奪。然而,由于微軟在投資ChatGPT上奪得關鍵先機,谷歌仍然在扮演奮力追趕的角色。
雖然谷歌慢了微軟一步,不過相對于其他硅谷巨頭的優勢較為明顯。在谷歌I/O開發者大會的同一日,摩根士丹利發布研究報告,看好谷歌在AI助手市場的前景。該報告認為,AI將創造一個6萬億美元的機會,要在AI助手領域的競爭中獲勝,需要硬件、自有數據和AI能力的三方面要素。
摩根士丹利認為,谷歌母公司Alphabet在這三個方面條件最好,比如Android設備在全球有26億臺,谷歌地圖、Gmail等生產力工具領先,未來可以和AI大模型進行深度整合。相比之下,亞馬遜和Meta的在硬件設備上存在不足,而蘋果的AI模型能力成疑。
揭秘推特新CEO:廣告界的“天鵝絨之錘”
圖片來源:推特截圖
去年12月,馬斯克曾表示,“一旦我找到一個足夠愚蠢的人來接手這份工作,我就會辭去推特CEO一職!”? ?
5個月后,他終于找到了。當地時間5月12日,馬斯克發布推文官宣NBCUniversal原全球廣告業務主管Linda Yaccarino將出任推特首席執行官。她將主要專注業務運營,而馬斯克更關注產品設計和新技術。
據悉,《華爾街日報》援引知情人士消息稱,NBC環球的全球廣告和合作伙伴主席琳達·雅卡里諾(Linda Yaccarino)正在洽談成為推特新任CEO的事宜。
雅卡里諾畢業于賓州州立大學,據NBC環球官網,她目前管理著一個約2000名員工的團隊,2011年至今(也就是雅卡里諾入職NBC環球以來),這個團隊創造的廣告銷售額累計已突破1000億美元。
在NBC環球,雅卡里諾作為關鍵人物推出了由廣告收入支持運營的流媒體服務Peacock,主導了美國超級碗和奧運會等現場的直播活動,并在數據和技術能力方面進行了大量投資。此外,雅卡里諾還與包括Snapchat、Apple News、YouTube和推特在內的多家科技公司建立了合作關系。
目前在NBC環球,雅卡里諾負責管理大約130億美元的年度廣告收入,她與營銷人員和廣告公司關系密切也是眾所周知。雅卡理諾以強硬的談判策略著稱,媒體公司將她形容為“天鵝絨之錘”。在NBC環球任職的同時,雅卡里諾還在今年2月被任命為人才管理公司YMU的董事會主席,后者的客戶包括美國女演員艾米麗·拉塔科斯基在內的眾多名人。
為什么是她?
雅卡里諾在廣告界的豐富經驗和出色成績,或許正是馬斯克想要的。目前,推特正面臨著廣告業務下滑的問題,而廣告業務一直是推特的主要收入來源。2021年,也就是馬斯克收購推特的前一年,廣告收入占推特總收入的近90%。
然而,馬斯克收購后,推特迎來了全面的預算削減、轉型變革以及反復無常和不可預測的決策,讓大量廣告主紛紛逃離,其管理之道也面臨批評之聲。在今年3月份的一次投資者會議上,馬斯克表示,推特的廣告收入已經下滑50%,在收購完成后幾個月內就站到了破產邊緣。
Sensor Tower的數據顯示,推特2021年的前100名廣告客戶中,有37家今年一季度沒有在該社交平臺上投放任何廣告,另外還有24家將推特上的平均月度廣告支出減少了80%以上。
不難看出,雅卡里諾成為替任者后,是選擇將推特恢復成馬斯克收購前的狀態,還是把推特轉變成全新的一家科技公司,將成為她上任以后的關鍵看點。
上個月,雅卡里諾在邁阿密的一個大型廣告會議上采訪了馬斯克,主題為“推特2.0:從對話到合作”,并在節目現場稱馬斯克為“朋友”和“伙伴”。此外,雅卡里諾還與推特負責全球銷售和營銷的副總裁克里斯·雷迪建立了聯系。
最看多AI的孫正義,踏空了AI
圖片來源:視覺中國
5月11日,軟銀集團發布截至3月31日的2022財年第四季度及全年財報。受科技股的拖累,軟銀連續第二財年虧損,旗下愿景基金2022財年巨虧逾4.3萬億日元(約合320億美元),同比擴大68.8%。
多年以來,軟銀創始人孫正義一直宣揚AI是改變人類使用技術的革命性力量,甚至將AI視為軟銀的未來,但他卻完美避開了時下最火爆的OpenAI。
不少人將孫正義踏空AI歸因于其“防御戰略”。在該戰略的指引下,軟銀愿景基金2022財年投資支出總額只有31億美元,其中第四財季(2023年第一季度)僅投資了4億美元。而相比之下,2021財年軟銀巔峰時期的投資支出達到了440億美元。
但在全世界都在追逐的AI浪潮中,孫正義并不想掉隊。在公布年度業績的前一天,軟銀宣布將開發日本版ChatGPT,目前已經組織了大約1000人的團隊。
美財長耶倫拒絕承諾美國將維持償債義務
將在兩周內向國會更新債務違約的“X日期”
圖片來源:視覺中國
據美聯社報道,美國白宮和國會助手表示,美國總統拜登原定于當地時間12日與國會領導人就債務上限問題進行談判,目前,該會談已被推遲至下周。
當地時間11日,七國集團財長和央行行長會議在日本新潟召開。美國財政部長耶倫在會前再次警告說,美國如果發生債務違約將引發嚴重后果,將令美國和世界經濟都遭受重創。
國際貨幣基金組織發言人科扎克在同日表示,該組織暫時無法具體量化美國債務違約對全球經濟的影響,但由此造成的利率上升或將導致美國銀行業進一步動蕩。國際貨幣基金組織敦促美國各方緊急解決當前的債務上限問題,避免出現債務違約。
瑞士“爆雷”后,避險資金盯上這里
圖片來源:視覺中國
瑞信危機中,瑞士監管局將瑞信160億瑞郎AT1債券全額減計后,原本作為全球財富管理中心的瑞士信譽大幅受損,從而驅動資金從瑞士撤出。
據路透社,從近日新加坡主要銀行發布的2023財年首季度業績報告來看,新加坡成為了這筆資金的重要承接地。新加坡星展銀行2023年第一季度收入增長34%至49.4億新元(約合37億美元),凈利潤同比增長43%至創紀錄的25.7億新元( 約合19億美元 ),凈息差上升66個基點。
財報披露,3月星展銀行的新資金流入幾乎翻了一番,達到36億新元,一季度新資金的凈流入總額為62億新元,相比之下,2022年的平均月資金流入約20億新元。業績會上,星展銀行CEO在回答有關銀行危機和瑞信減計AT1債券的問題時表示,很難估計由瑞信引發的新資金流入量,過去一年該銀行一直是新資金流入的受益者,資金流入來自北亞以及其他銀行,包括美國出現困境的銀行以及瑞信。
英國將向烏克蘭軍隊提供“風暴之影”巡航導彈
圖片來源:央視新聞
5月11日,英國國防大臣華萊士向英國議會證實,英國正向烏克蘭提供“風暴之影”巡航導彈?,這將令烏克蘭軍隊有能力打擊位于戰線后方的俄軍部隊、彈藥庫和燃料庫。此外,華萊士稱,英方提供的“挑戰者-2”主戰坦克已全部移交給烏克蘭。
“風暴之影”導彈由歐洲導彈集團制造,該型導彈由戰機發射,其射程超過250公里。
對于英國向烏克蘭提供巡航導彈,俄羅斯總統新聞秘書佩斯科夫11日表示,俄羅斯持極其否定的態度,俄方將會采取必要的回應措施 。
微軟下注核聚變,與Helion簽訂購電協議
圖片來源:視覺中國
當地時間周三(5月10日),核聚變初創公司Helion能源在官網宣布,科技巨頭微軟已同意從公司首座核聚變發電站購買電力。
作為電力購買協議的一部分,Helion預計將在2028年之前將其聚變發電裝置上線,并在商定的一年內達到50兆瓦或更高目標的發電量。當聚變裝置完全能達到產生50兆瓦能量的速度時,它將能夠為華盛頓州約40000戶家庭供電。
據CNBC,Helion成立于2013年,總部位于華盛頓州埃弗雷特,擁有約150名員工。到目前為止,Helion已經籌集了超過5.7億美元的私人資本。值得注意的是,OpenAI的創始人Sam Altman也是Helion早期和最重要的投資者之一,他向Helion投資了3.75億美元,外媒稱這是其“有史以來”最大的投資。Altman認為,Helion和OpenAI同樣重要,并且都是人類未來的相關組成部分。
記者|李孟林 蔡鼎 譚玉涵
編輯|高涵 譚玉涵 何小桃 杜恒峰
校對|盧祥勇
|每日經濟新聞 ?nbdnews??原創文章|
未經許可禁止轉載、摘編、復制及鏡像等使用
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP