百川大模型公眾號(hào)今日發(fā)文宣布,百川智能推出一站式大模型商業(yè)化解決方案,包含全鏈路通用訓(xùn)練數(shù)據(jù),Baichuan4-Turbo、Baichuan4-Air 兩款模型和全鏈路領(lǐng)域增強(qiáng)工具鏈,可幫助企業(yè)實(shí)現(xiàn)低成本私有化部署,實(shí)現(xiàn)高達(dá) 96% 的多場(chǎng)景可用率。
據(jù)悉,該方案具備“工具豐富、響應(yīng)快速、效果顯著、成本低廉”的特性,在 Baichuan4-Turbo、Baichuan4-Air 的基礎(chǔ)上,再結(jié)合超參動(dòng)態(tài)搜索和自適應(yīng)配比等算法,與企業(yè)私有數(shù)據(jù)混合微調(diào),兩個(gè)模型多場(chǎng)景下的可用率可獲得極大提升,在金融、教育、醫(yī)療等場(chǎng)景下的專業(yè)細(xì)分任務(wù)的平均可用率高達(dá) 96%。
附兩個(gè)模型的主要特征如下:
Baichuan4-Turbo—— 探索復(fù)雜場(chǎng)景:
文本生成、知識(shí)問(wèn)答、多語(yǔ)言處理、數(shù)據(jù)分聚類等核心能力均有顯著提升,其中信息摘要總結(jié)能力大幅提升了 50%;
只需 2 卡 4090 的算力即可完成部署;
推理成本只有 Baichuan 4 的 15%;
相較 Baichuan 4 首 Token 速度提升 51%、Token 流速提升 73%;
Baichuan4-Air—— 經(jīng)過(guò)驗(yàn)證的較大規(guī)模流量的場(chǎng)景:
效果與 Baichuan 4 基本持平;
推理成本僅為 Baichuan 4 的 1%;
百萬(wàn) Token 只需 0.98 元;
相較 Baichuan 4 首 Token 速度提升 77%、Token 流速提升 93%;
官方更表示,在相同訓(xùn)練數(shù)據(jù)下,Baichuan4-Air 不僅時(shí)效率更高,性能也大幅領(lǐng)先于 GPT4-style、Mixtral-style 結(jié)構(gòu)的 MoE 模型。
目前,該方案能夠高效適配英偉達(dá) 4090 / A / H 系列、華為昇騰、寒武紀(jì)、高通、MTK、天數(shù)等多種主流芯片。