亞馬遜于當?shù)貢r間周一正式發(fā)布了其通用人工智能智能體(AI agent) ——Nova Act。該智能體具備操控網(wǎng)絡瀏覽器并自主執(zhí)行簡單網(wǎng)絡任務的能力。與此同時,亞馬遜還推出了配套的 Nova Act 軟件開發(fā)工具包(SDK),旨在幫助開發(fā)者利用 Nova Act 構建智能體應用原型。
據(jù)IT之家了解,Nova Act 由亞馬遜新近在舊金山成立的 AGI(通用人工智能)實驗室研發(fā),該技術未來也將為備受期待的生成式 AI 增強版語音助手 Alexa + 提供關鍵功能支持。不過,亞馬遜方面表示,今日起開放的版本為“研究預覽版”,功能尚待完善。
開發(fā)者可以通過新設立的專屬網(wǎng)站 nova.amazon.com獲取 Nova Act 工具包,該網(wǎng)站同時也是亞馬遜展示其旗下各類 Nova 基礎模型的平臺。
Nova Act 的推出標志著亞馬遜正式加入 AI 智能體技術的競爭行列,意在憑借自研的通用 AI 智能體技術,與 OpenAI 的 Operator 和 Anthropic 的 Computer Use 等產(chǎn)品展開競爭。當前,多家領先科技公司普遍認為,能夠代替用戶瀏覽網(wǎng)頁、執(zhí)行任務的 AI 智能體將極大提升現(xiàn)有 AI 聊天機器人的實用性。盡管亞馬遜并非首家開發(fā)此類技術的公司,但憑借其龐大的 Alexa 用戶基礎,Nova Act 未來可能擁有最廣泛的應用潛力。
亞馬遜介紹稱,開發(fā)者使用 Nova Act SDK,將能夠為用戶自動化處理一些基礎性網(wǎng)絡操作,例如從餐飲品牌 Sweetgreen 訂購沙拉或是在線上預訂餐廳晚餐。該工具包提供了一系列工具,使 AI 智能體能夠瀏覽網(wǎng)頁、填寫表單、在日歷上選擇日期等。
在性能方面,亞馬遜聲稱,在公司內部的多項測試中,Nova Act 的表現(xiàn)優(yōu)于來自 OpenAI 和 Anthropic 的同類智能體。以衡量 AI 智能體與屏幕文本交互能力的 ScreenSpot Web Text 測試為例,Nova Act 得分高達 94%,超過了 OpenAI 的 CUA(88%)和 Anthropic 的 Claude 3.7 Sonnet(90%)。然而值得注意的是,亞馬遜并未公布 Nova Act 在如 WebVoyager 等行業(yè)更常用的智能體評估基準上的測試結果。
Nova Act 是亞馬遜上述 AGI 實驗室對外發(fā)布的首個公開產(chǎn)品。該實驗室由前 OpenAI 研究員 David Luan 和 Pieter Abbeel 共同領導。這兩位專家在去年被亞馬遜聘用以主導其 AI 智能體研發(fā)工作之前,分別創(chuàng)立了 AI 初創(chuàng)公司 Adept 和 Covariant。
對于一個以 AGI 為目標的實驗室為何會開發(fā)訂購沙拉的 AI 智能體,Luan 在接受 TechCrunch 采訪時解釋道,他將智能體視為構建超智能 AI 系統(tǒng)的關鍵一步。他將 AGI 定義為“一個能夠幫助你在計算機上完成人類所能做的任何事情的 AI 系統(tǒng)”。Luan 還表示,其團隊設計的 Nova Act SDK 旨在可靠地自動化執(zhí)行簡短、簡單的任務,并為開發(fā)者提供了精確定義何時需要人類介入智能體工作流程的工具。他希望借此幫助開發(fā)者創(chuàng)建更可靠的智能體應用,即使這些應用不一定是完全自主運行的。
目前,來自 OpenAI、谷歌和 Anthropic 等公司的早期 AI 智能體普遍面臨跨不同領域應用時可靠性不足的重大挑戰(zhàn)。根據(jù) TechCrunch 等媒體的測試,這些系統(tǒng)往往運行緩慢,難以長時間獨立工作,且容易犯下人類通常不會犯的錯誤。亞馬遜是否已經(jīng)找到了克服這些難題的有效方法,還是其 Nova Act 智能體也將受困于同樣的缺陷,市場將拭目以待。