C114通信網(wǎng)  |  通信人家園

人工智能
2024/11/19 15:16

Mistral發(fā)布Pixtral Large多模態(tài)AI模型:登頂復雜數(shù)學推理,圖表/文檔推理超過GPT-4o

IT之家  故淵

Mistral AI 公司昨日(11 月 18 日)發(fā)布公告,宣布了全新的多模態(tài) AI 模型 Pixtral Large。該模型擁有 1240 億參數(shù),基于 Mistral Large 2,主要用于處理文本和圖片。

Pixtral Large 現(xiàn)已在 Mistral 研究許可證和商業(yè)許可證下提供,適用于研究、教育以及商業(yè)用途。

Pixtral Large 是 Mistral AI 多模態(tài)家族中的第二個模型。IT之家援引官方新聞稿,該模型在 MathVista、DocVQA 和 VQAv2 等標準多模態(tài)基準測試中表現(xiàn)出色,尤其在 MathVista 中達到了 69.4% 的準確率,超越了所有競爭對手。

 

 

在 ChartQA 和 DocVQA 測試中,Pixtral Large 同樣表現(xiàn)優(yōu)異,超越了 GPT-4o 和 Gemini-1.5 Pro。

該模型配備了 123B 的多模態(tài)解碼器和 1B 的視覺編碼器,支持 128K 的上下文窗口,能夠處理至少 30 張高分辨率圖像。Pixtral Large 不僅在視覺數(shù)據(jù)上表現(xiàn)出色,同時在復雜推理和圖表理解方面也具備強大能力。

給作者點贊
0 VS 0
寫得不太好

免責聲明:本文僅代表作者個人觀點,與C114通信網(wǎng)無關。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內(nèi)容。

熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機版

      Copyright©1999-2024 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網(wǎng) 版權(quán)所有 舉報電話:021-54451141