12月18日上午消息,今日舉辦的火山引擎 Force 大會上,字節(jié)跳動正式發(fā)布發(fā)布豆包視覺理解模型,為企業(yè)提供極具性價比的多模態(tài)大模型能力。豆包視覺理解模型千tokens輸入價格僅為3厘,一元錢就可處理284張720P的圖片,比行業(yè)價格便宜85%,以更低成本推動AI技術(shù)普惠和應(yīng)用發(fā)展。
據(jù)火山引擎總裁譚待介紹,豆包視覺理解模型不僅能精準識別視覺內(nèi)容,還具備出色的理解和推理能力,可根據(jù)圖像信息進行復(fù)雜的邏輯計算,完成分析圖表、處理代碼、解答學(xué)科問題等任務(wù)。此外,該模型有著細膩的視覺描述和創(chuàng)作能力。
豆包3D生成模型也首次亮相。該模型與火山引擎數(shù)字孿生平臺veOmniverse結(jié)合使用,可以高效完成智能訓(xùn)練、數(shù)據(jù)合成和數(shù)字資產(chǎn)制作,成為一套支持AIGC創(chuàng)作的物理世界仿真模擬器。