AIGC開放社區 2024-11-14 12:04:34
彭博今天消息,OpenAI正準備推出一款代號為“Operator”的全新AI Agent產品,可以自動執行各種復雜操作,包括編寫代碼、預訂旅行、自動電商購物等。
根據內部員工爆料,OpenAI領導層預計將在2025年1月發布該產品,同時會為開發人員開放API接口。
彭博表示,OpenAI一直在進行幾個與智能體相關的研究項目。其中一位人士表示,最接近完成的將是一個在網絡瀏覽器中執行任務的通用工具。
OpenAI這一計劃的發布,是整個行業向智能體推進的一部分。最近微軟、谷歌、Anthropic都相繼發布了功能強大的AI Agent。
尤其是Anthropic發布的“Computer Use”直接顛覆了人機交互,通過API開發者可以讓Claude像人類一樣使用計算機控制鼠標、鍵盤,包括查看屏幕、移動光標、點擊按鈕和輸入文本等操作。
例如,用戶可以讓Claude去搜索網頁上的信息、在電子表格中填寫數據;或者打開軟件進行特定的操作;也能協助開發人員執行重復性任務、測試代碼等,整個流程Claude會根據指令自動執行相應的操作。
目前,Computer use主要依靠API來驅動自動化指令,當開發者通過API向Claude發送指令時,Claude會運用其自然語言處理能力解析指令。其內部語言模型會對指令文本進行詞法、句法和語義分析,例如,對于“使用計算機中的數據填寫在線表格”這樣的指令,Claude會識別出關鍵動作是填寫表格以及數據來源是計算機中的數據。
這一過程類似它在處理文本生成任務時對語義的理解,只是此時語義重點在于計算機操作。會基于預訓練過程中學到的語言模式和知識,將指令意圖映射到對應的計算機操作概念上,預訓練的知識包括常見的計算機操作術語、軟件功能描述等,以便準確把握開發者希望它執行的操作。
而OpenAI在明年發布的“Operator”很可能會在Computer use的基礎之上進行大幅度創新和應用簡化,擴大AI Agent的使用范圍和應用場景。
封面圖片來源:視覺中國-VCG31N2008743681
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP