每日經濟新聞 2023-03-15 10:07:24
每經編輯 畢陸名
3月15日,#GPT4做一個網站只要十秒#登上熱搜。
當地時間周二(3月14日),人工智能研究公司OpenAI公布了其大型語言模型的最新版本——GPT-4。幾乎所有的辦公室案頭工作,GPT-4無所不能。比如,10秒鐘就能做出一個網站,程序員們也該失業了?每個人都該看一下昨天(3月14日)GPT4的發布會,下面摘出來的這兩分鐘時間,演示的是:
1、在草稿本上用紙筆畫出一個非常粗糙的草圖;
圖片來源:視頻截圖
2、拍照告訴GPT我要做一個網站長這樣,給我生成網站代碼;
3、網站做完,總共歷時十秒鐘左右。
圖片來源:視頻截圖
此外,該公司還表示,GPT-4在許多專業測試中表現出超過絕大多數人類的水平。OpenAI還稱,GPT-4參加了多種基準考試測試,包括美國律師資格考試Uniform Bar Exam、法學院入學考試LSAT、“美國高考”SAT數學部分和證據性閱讀與寫作部分的考試,在這些測試中,它的得分高于88%的應試者。
OpenAI周二表示,在內部評估中,GPT-4產生正確回應的可能性要比GPT-3.5高出40%。而且GPT-4是多模態的,同時支持文本和圖像輸入功能。OpenAI稱,GPT-4比以前的版本“更大”,這意味著其已經在更多的數據上進行了訓練,并且在模型文件中有更多的權重,這使得它的運行成本更高。
據OpenAI介紹,在某些情況下,GPT-4比之前的GPT-3.5版本有了巨大改進,新模型將產生更少的錯誤答案,更少地偏離談話軌道,更少地談論禁忌話題,甚至在許多標準化測試中比人類表現得更好。
例如,GPT-4在模擬律師資格考試的成績在考生中排名前10%左右,在SAT閱讀考試中排名前7%左右,在SAT數學考試中排名前11%左右。
OpenAI表示,已經與多家公司合作,要將GPT-4結合到他們的產品中,包括Duolingo、Stripe和Khan Academy。GPT-4模型也將以API的形式,提供給付費版ChatGPT Plus的訂閱用戶。開發者可以注冊,用它打造應用。微軟此后表示,新款的必應(Bing)搜索引擎將運行于GPT-4系統之上。
OpenAI表示,雖然兩個版本在日常對話中看起來很相似,但當任務復雜到一定程度時,差異就表現出來了,GPT-4更可靠、更有創造力,能夠處理更微妙的指令。“在我們的內部評估中,它產生正確回應的可能性比GPT-3.5高40%。”
此外,GPT-4還有了一個質的飛躍——可以開始處理圖像。經常使用ChatGPT的人肯定知道,它只能處理文本,但GPT-4開始接受圖像作為輸入介質。在OpenAI提供的一個示例中,GPT-4準確地回答了幾個網絡meme為什么搞笑的問題(雖然解釋得并不好笑)。
不過,OpenAI也警告稱,GPT-4還不完美,在許多情況下,它的能力不如人類。該公司表示:“GPT-4仍有許多已知的局限性,我們正在努力解決,比如社會偏見、幻覺和對抗性提示。”
OpenAI透露,摩根士丹利正在使用GPT-4來組織數據,而電子支付公司Stripe正在測試GPT-4是否有助于打擊欺詐。其他客戶還包括語言學習公司Duolingo、Khan Academy和冰島政府。
每日經濟新聞綜合OpenAI官網
封面圖片來源:視覺中國
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP