當(dāng)?shù)貢r間 10 月 22 日,Anthropic 推出了升級版的 Claude 3.5 Sonnet 以及新的 Claude 3.5 Haiku 模型,升級版 Claude 3.5 Sonnet 不僅編程能力更強,還帶來全新功能 computer use(計算機使用),支持像人類一樣操作計算機,可以遵循用戶的命令在計算機屏幕上移動光標(biāo),點擊相關(guān)位置,并通過虛擬鍵盤輸入信息,模擬人們與自己計算機的交互方式。
升級版 Claude 3.5 Sonnet 現(xiàn)已可以使用,computer use 測試版也已開放使用。
進(jìn)化后的 Claude 3.5 Sonnet 在各個方面得到了全面顯著的提升,尤其是業(yè)界領(lǐng)先的編碼能力。
Anthropic 首席科學(xué)官 Jared Kaplan 表示:“我認(rèn)為我們將進(jìn)入一個新時代,模型可以像人一樣使用所有的工具來完成任務(wù)。”
升級版 Claude 3.5 Sonnet 的發(fā)布標(biāo)志著 Anthropic 在商業(yè) AI 模型領(lǐng)域的一項重要進(jìn)展。該模型旨在超越傳統(tǒng)的聊天框,成為真正的“AI 代理”。
所謂的“AI 代理”是指能夠像人類一樣使用軟件并執(zhí)行其他計算機任務(wù)的 AI 模型。有些 AI 代理,如 Cognition AI 的 Devin,專門用于編程。而 Anthropic 則將其 AI 代理定位為一個多面手,聲稱它可以瀏覽網(wǎng)頁并使用任何網(wǎng)站或應(yīng)用程序。用戶可以根據(jù)自己的需求來使用 AI 代理,無論是編程等技術(shù)任務(wù),還是旅行規(guī)劃等簡單任務(wù)。
在 Wired 描述的一個演示中,Claude 被要求規(guī)劃一次與朋友一起在日出時觀看金門大橋的旅行。AI 打開了一個網(wǎng)頁瀏覽器,在谷歌上搜索了一個好的觀景點和其他細(xì)節(jié),并將行程添加到日歷應(yīng)用程序中。雖然令人印象深刻,但 Wired 指出,Claude 沒有考慮到其他有用的細(xì)節(jié),比如如何到達(dá)那里。
在另一個演示中,Claude 被要求創(chuàng)建一個簡單的網(wǎng)站,它使用微軟的 Visual Studio Code 來完成這項任務(wù),甚至打開了一個本地服務(wù)器來測試它剛剛創(chuàng)建的網(wǎng)站。雖然在創(chuàng)建過程中出現(xiàn)了一個小錯誤,但當(dāng)給予提示后,其糾正了代碼。
然而,盡管這些 AI 模型看起來很有前景,但它們?nèi)匀淮嬖诳煽啃缘膯栴},尤其是在編寫代碼方面,Anthropic 的模型也不例外。據(jù) TechCrunch 報道,即使在簡單的測試中,如預(yù)訂航班和修改預(yù)訂,Claude 3.5 Sonnet 也只成功完成了不到一半的任務(wù)。
除了技術(shù)上的不完善,AI 代理還帶來了明顯的安全風(fēng)險。用戶是否愿意讓這些不穩(wěn)定且有時難以預(yù)測的技術(shù)訪問個人電腦文件并使用網(wǎng)絡(luò)瀏覽器,仍是一個值得深思的問題。
Anthropic 對此表示,通過逐步開放這種有限、相對更安全的 AI 模型,能夠幫助提升 AI 代理的安全性。他們在聲明中寫道:“我們認(rèn)為,與其等到更強大的模型出現(xiàn),不如讓現(xiàn)有較為安全的模型接觸電腦,這樣我們可以開始觀察并應(yīng)對潛在問題,在提升使用水平的同時逐步增強安全措施。”