棉签冰块pp夹子,一级毛片不收费的

C114
通信人家園
English
公眾號(hào)矩陣

投稿
舉報(bào)

量子大觀

通信人家園

C114通信網(wǎng)

光通信觀察

DVBCN中廣5G

2024/9/11 13:29

Reflection 70B AI模型“塌房”：第三方基準(zhǔn)測(cè)試結(jié)果不佳，不如LLaMA-3.1-70B

IT之家故淵

科技媒體 The Decoder 昨日（9 月 10 日）報(bào)道，對(duì)比平臺(tái) Artificial Analysis 相關(guān)數(shù)據(jù)表明，Reflection 70B AI 模型在基準(zhǔn)測(cè)試中的表現(xiàn)，實(shí)際上不及 Meta 的 LLaMA-3.1-70B。

針對(duì) AI 模型基準(zhǔn)測(cè)試結(jié)果不佳，Reflection 公司首席執(zhí)行官馬特舒默（Matt Shumer）表示，上傳模型權(quán)重至 Hugging Face 時(shí)遇到問(wèn)題，所使用的權(quán)重是多個(gè)不同模型的混合體，而他們內(nèi)部托管的模型則顯示出更佳的結(jié)果。

舒默隨后向部分用戶提供了獨(dú)家訪問(wèn)內(nèi)部模型的權(quán)限，Artificial Analysis 重做了測(cè)試，并報(bào)告結(jié)果優(yōu)于公開(kāi) API，只是他們無(wú)法確認(rèn)所訪問(wèn)的具體是哪個(gè)模型。

Reflection 在 Hugging Face 已上傳了新的模型，不過(guò)這些模型在測(cè)試中的表現(xiàn)明顯遜于之前通過(guò)私有 API 提供的模型。

查詢公開(kāi)資料，有用戶還發(fā)現(xiàn)了證據(jù)，表明 Reflection API 有時(shí)會(huì)調(diào)用 Anthropic Claude 3.5 Sonnet 以及 OpenAI。

舒默旗下公司 OthersideAI 此前已宣布計(jì)劃于本周發(fā)布一款基于 LLaMA 3.1 450B 的更大、更強(qiáng)大的模型。

舒默對(duì)這一即將發(fā)布的版本做出了大膽聲明，稱其不僅將成為最佳的開(kāi)源模型，還將是有史以來(lái)最優(yōu)秀的語(yǔ)言模型。

官方回應(yīng)：

免責(zé)聲明：本文僅代表作者個(gè)人觀點(diǎn)，與C114通信網(wǎng)無(wú)關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí)，對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾，請(qǐng)讀者僅作參考，并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。

給作者點(diǎn)贊

0 VS 0

寫得不太好

相關(guān)鏈接

測(cè)試 AI OpenAI

自研模型進(jìn)度緩慢，古爾曼稱蘋果 Siri 正考慮轉(zhuǎn)向 Anthropic 或 OpenAI 技術(shù)合作
IT之家問(wèn)舟7-1
2025 MWC 上海盛大開(kāi)幕，聚焦AI、5G-Advanced及開(kāi)放API
C114通信網(wǎng) 6-18
微軟宣布 Azure AI 平臺(tái)將接入 OpenAI Sora 視頻生成 API，填補(bǔ)功能空缺
IT之家問(wèn)舟5-20
基于OpenAPI的IMS業(yè)務(wù)平臺(tái)架構(gòu)研究
郵電設(shè)計(jì)技術(shù) 孟濤，張晶晶，關(guān) 威5-15

特別策劃