C114通信網(wǎng)  |  通信人家園

人工智能
2024/8/31 20:34

OpenAI的GPT-4變身考證能手:無額外訓(xùn)練通過日本理療師考試,正確率 73.4%

IT之家  故淵

一項新的同行評審研究表明,OpenAI 的 GPT-4 大語言模型無需任何額外訓(xùn)練,即可通過日本國家理療考試。

最新發(fā)表在《Cureus》雜志上的新研究,測試了 GPT-4 的文字和視覺技能。

IT之家注:日本國家物理理療師考試包括 160 道綜合題和 40 道實踐題,測試記憶、理解、應(yīng)用、分析和評估能力。

研究人員在 GPT-4 中輸入了 1000 個問題,并將答案對比了官方解決方案。

GPT-4 通過了所有五個測試部分,正確回答了 73.4% 的問題。不過,人工智能在處理技術(shù)性問題和包含圖片或表格的問題時顯得有些吃力。

該模型在常規(guī)問題上的表現(xiàn)(正確率為 80.1%)遠遠好于實際問題(正確率為 46.6%)。

同樣,GPT-4 在處理純文本問題(正確率為 80.5%)時的表現(xiàn)也遠好于那些帶有圖片和表格的問題(正確率為 35.4%)。這些發(fā)現(xiàn)與之前有關(guān) GPT-4 視覺理解局限性的研究結(jié)果一致。

有趣的是,問題難度和文本長度對 GPT-4 的性能影響不大。盡管該模型主要以英語數(shù)據(jù)為基礎(chǔ)進行訓(xùn)練,但在使用日語輸入時也表現(xiàn)出色。

給作者點贊
0 VS 0
寫得不太好

免責(zé)聲明:本文僅代表作者個人觀點,與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。

熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機版

      Copyright©1999-2024 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網(wǎng) 版權(quán)所有 舉報電話:021-54451141