2024/10/28 08:51

OpenAI語音轉(zhuǎn)寫工具Whisper被曝存在重大缺陷：會憑空生成大段虛假內(nèi)容

IT之家清源

當?shù)貢r間 27 日，據(jù)美聯(lián)社報道，超過十位軟件工程師、開發(fā)人員和學(xué)術(shù)研究人員稱，OpenAI 的語音轉(zhuǎn)寫工具 Whisper 存在一個重大缺陷：有時會憑空生成大段甚至整句虛假內(nèi)容。

這些專家指出，這些生成的文本（IT之家注：業(yè)內(nèi)通常稱為“AI 幻覺”）可能涉及種族言論、暴力措辭，甚至杜撰的醫(yī)療建議。

專家們認為，這一問題尤其令人擔憂，因為 Whisper 已被廣泛應(yīng)用于全球多個行業(yè)，包括用于翻譯和轉(zhuǎn)錄訪談內(nèi)容、生成常見消費科技文本及制作視頻字幕。

更具風險的是，盡管 OpenAI已提醒不應(yīng)在“高風險領(lǐng)域”使用該工具，但一些醫(yī)療機構(gòu)仍在匆忙采用基于 Whisper 的工具來記錄醫(yī)生與患者的咨詢記錄。

報道稱，研究人員和工程師在工作中經(jīng)常遇到 Whisper 的“幻覺”現(xiàn)象，問題的整體規(guī)模尚不清楚。例如，密歇根大學(xué)一位研究員在研究公共會議時發(fā)現(xiàn)，在嘗試改進模型前，他所檢查的十份音頻轉(zhuǎn)錄中，八份含有虛構(gòu)內(nèi)容。

一位機器學(xué)習工程師透露，在最初分析的超過 100 小時 Whisper 轉(zhuǎn)錄中，他發(fā)現(xiàn)大約一半的內(nèi)容存在“幻覺”現(xiàn)象。一位開發(fā)人員進一步指出，在他用 Whisper 生成的 26000 份轉(zhuǎn)錄中，幾乎每一份都帶有虛構(gòu)內(nèi)容。

即便是音質(zhì)良好的簡短音頻樣本，也未能幸免于這些問題。計算機科學(xué)家們的最新研究表明，他們審查的 13000 多段清晰音頻片段中，有 187 段出現(xiàn)了“幻覺”現(xiàn)象。

研究人員認為，這一趨勢意味著，在數(shù)百萬條錄音中將可能出現(xiàn)數(shù)以萬計的錯誤轉(zhuǎn)錄。

OpenAI 的發(fā)言人表示，該公司持續(xù)研究如何減少幻覺，并且感謝研究者的發(fā)現(xiàn)，將會在模型更新中采納反饋。

給作者點贊

0 VS 0

寫得不太好

免責聲明：本文僅代表作者個人觀點，與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實，對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾，請讀者僅作參考，并請自行核實相關(guān)內(nèi)容。

相關(guān)鏈接

計算機

阿爾特曼暗示OpenAI明日發(fā)布o3，新一代AI推理王者模型
IT之家故淵12-20
OpenAI ChatGPT變身桌面助手：支持Xcode、Notion等30+應(yīng)用，AGI彩蛋曝光
IT之家故淵12-20
蘋果與騰訊、字節(jié)跳動就AI合作進行商討
C114通信網(wǎng) 岳明12-19
消息稱OpenAI 擬斥巨資“贖身”，擺脫非營利組織控制
IT之家遠洋12-19