頭條

GPT-4太強了，10秒鐘做出一個網站，考試中擊敗90%的人類

每日經濟新聞 2023-03-15 10:07:24

每經編輯畢陸名

3月15日，#GPT4做一個網站只要十秒#登上熱搜。

當地時間周二（3月14日），人工智能研究公司OpenAI公布了其大型語言模型的最新版本——GPT-4。幾乎所有的辦公室案頭工作，GPT-4無所不能。比如，10秒鐘就能做出一個網站，程序員們也該失業了？每個人都該看一下昨天（3月14日）GPT4的發布會，下面摘出來的這兩分鐘時間，演示的是：

1、在草稿本上用紙筆畫出一個非常粗糙的草圖；

圖片來源：視頻截圖

2、拍照告訴GPT我要做一個網站長這樣，給我生成網站代碼；

3、網站做完，總共歷時十秒鐘左右。

圖片來源：視頻截圖

此外，該公司還表示，GPT-4在許多專業測試中表現出超過絕大多數人類的水平。OpenAI還稱，GPT-4參加了多種基準考試測試，包括美國律師資格考試Uniform Bar Exam、法學院入學考試LSAT、“美國高考”SAT數學部分和證據性閱讀與寫作部分的考試，在這些測試中，它的得分高于88%的應試者。

OpenAI周二表示，在內部評估中，GPT-4產生正確回應的可能性要比GPT-3.5高出40%。而且GPT-4是多模態的，同時支持文本和圖像輸入功能。OpenAI稱，GPT-4比以前的版本“更大”，這意味著其已經在更多的數據上進行了訓練，并且在模型文件中有更多的權重，這使得它的運行成本更高。

據OpenAI介紹，在某些情況下，GPT-4比之前的GPT-3.5版本有了巨大改進，新模型將產生更少的錯誤答案，更少地偏離談話軌道，更少地談論禁忌話題，甚至在許多標準化測試中比人類表現得更好。

例如，GPT-4在模擬律師資格考試的成績在考生中排名前10%左右，在SAT閱讀考試中排名前7%左右，在SAT數學考試中排名前11%左右。

OpenAI表示，已經與多家公司合作，要將GPT-4結合到他們的產品中，包括Duolingo、Stripe和Khan Academy。GPT-4模型也將以API的形式，提供給付費版ChatGPT Plus的訂閱用戶。開發者可以注冊，用它打造應用。微軟此后表示，新款的必應（Bing）搜索引擎將運行于GPT-4系統之上。

OpenAI表示，雖然兩個版本在日常對話中看起來很相似，但當任務復雜到一定程度時，差異就表現出來了，GPT-4更可靠、更有創造力，能夠處理更微妙的指令。“在我們的內部評估中，它產生正確回應的可能性比GPT-3.5高40%。”

此外，GPT-4還有了一個質的飛躍——可以開始處理圖像。經常使用ChatGPT的人肯定知道，它只能處理文本，但GPT-4開始接受圖像作為輸入介質。在OpenAI提供的一個示例中，GPT-4準確地回答了幾個網絡meme為什么搞笑的問題（雖然解釋得并不好笑）。