百川智能今日發(fā)布全鏈路領(lǐng)域增強(qiáng)金融大模型 Baichuan4-Finance,融合 100B + 中英文金融知識(shí),采用多層次質(zhì)量評(píng)估體系進(jìn)行篩選,由人民大學(xué)財(cái)政金融學(xué)院金融專家團(tuán)隊(duì)全程參與定義和評(píng)估。
在中國(guó)人民大學(xué)財(cái)政金融學(xué)院新近發(fā)布的評(píng)測(cè)體系 FLAME 以及國(guó)內(nèi)開(kāi)源金融評(píng)測(cè)基準(zhǔn) FinancelQ 上,Baichuan4-Finance 均登上榜首,金融專業(yè)能力和場(chǎng)景應(yīng)用能力領(lǐng)先 GPT-4o。
Baichuan4-Finance API 現(xiàn)已在百川智能官網(wǎng)正式上線,附測(cè)試成績(jī)?nèi)缦拢?/p>
FLAME-Cer 評(píng)測(cè)結(jié)果顯示,Baichuan4-Finance 在銀行、保險(xiǎn)、基金、證券等多個(gè)資格認(rèn)證領(lǐng)域的準(zhǔn)確率均突破了 95%,整體準(zhǔn)確率 93.62%,大幅領(lǐng)先 GPT-4o 和 XuanYuan3-70B-Chat,超出 GPT-4o 近 20%。
Baichuan4-Finance 在 FLAME-Sce 評(píng)測(cè)中,一級(jí)核心金融業(yè)務(wù)場(chǎng)景的整體可用率達(dá) 84.15%,金融數(shù)據(jù)計(jì)算、金融知識(shí)理論等場(chǎng)景的可用率超過(guò) 90%。
在國(guó)內(nèi)開(kāi)源金融評(píng)測(cè)基準(zhǔn) FinanceIQ 中,Baichuan4-Finance 同樣超越了 GPT-4o 和 XuanYuan3-70B,整體準(zhǔn)確率達(dá)到 79.23%,領(lǐng)先 GPT-4o 近 13%。