近日,硅心科技(aiXcoder)助力國內(nèi)頭部通信企業(yè)落地企業(yè)專屬大模型,通過“增量預(yù)訓(xùn)練+后訓(xùn)練”技術(shù)、“大模型+小模型”策略、全鏈路私域數(shù)據(jù)治理體系、融入工作流和Agent技術(shù)等創(chuàng)新方案,實現(xiàn)代碼生成準(zhǔn)確率從20%提升至45%;企業(yè)知識問答準(zhǔn)確率從51%提升至69%,突破了通用大模型“缺乏企業(yè)私域知識、不了解業(yè)務(wù)”的企業(yè)落地難題。
“不是模型不夠強(qiáng),而是它不懂行”
數(shù)字化轉(zhuǎn)型的深入發(fā)展,讓各行業(yè)對于高效、穩(wěn)定且安全的網(wǎng)絡(luò)連接需求日益增長。某大型通信公司作為行業(yè)頭部企業(yè),希望通過技術(shù)創(chuàng)新提升研發(fā)效能和市場競爭力,為千行百業(yè)筑牢關(guān)鍵數(shù)字底座。為此,該企業(yè)將大模型引入生產(chǎn)實踐,期望大模型在企業(yè)知識問答、單元測試生成、代碼生成等真實場景中提供智能輔助,以提升軟件開發(fā)效率,降低開發(fā)成本。
然而,在實際的應(yīng)用中,大模型因缺乏企業(yè)私域數(shù)據(jù)和知識,如專有協(xié)議棧、設(shè)備交互邏輯等,輸出的效果并不理想——知識問答常出現(xiàn)答非所問或泛泛而談;輸出結(jié)果缺乏業(yè)務(wù)邏輯支撐,可信度較低;生成的代碼需工程師花費大量時間審查、修正甚至重寫。
“不是模型不夠強(qiáng),而是它不懂‘行話’!企業(yè)發(fā)現(xiàn),RAG(Retrieval-Augmented Generation,檢索增強(qiáng)生成)等通用方案雖能通過知識檢索輔助問答,卻難以實現(xiàn)深度業(yè)務(wù)推理。
為此,企業(yè)選擇與在“AI+軟件工程”領(lǐng)域具備深厚技術(shù)積累和豐富落地經(jīng)驗的硅心科技(aiXcoder)合作,通過訓(xùn)練企業(yè)專屬大模型,將企業(yè)數(shù)據(jù)和知識深度注入模型。
深度定制企業(yè)專屬大模型,重構(gòu)模型“大腦”
具體實施方案如下:
一、多維度綜合評估,選擇最優(yōu)開源模型。硅心科技(aiXcoder)貼合企業(yè)現(xiàn)有算力資源和任務(wù)需求,從模型的基礎(chǔ)效果、計算資源、推理效率以及應(yīng)用可行性等方面進(jìn)行綜合考慮,并結(jié)合硅心科技(aiXcoder)專業(yè)模型評測體系、官方基準(zhǔn)測試、中文理解評測、第三方模型排行榜等多方結(jié)果,交叉驗證,為企業(yè)選出綜合表現(xiàn)最優(yōu)、與企業(yè)通信業(yè)務(wù)場景最適配的開源大模型作為領(lǐng)域化訓(xùn)練的堅實基礎(chǔ)。
二、企業(yè)私域數(shù)據(jù)治理,構(gòu)建高質(zhì)量訓(xùn)練語料。硅心科技(aiXcoder)指導(dǎo)企業(yè)系統(tǒng)性梳出內(nèi)外部知識資產(chǎn),并對數(shù)據(jù)進(jìn)行預(yù)處理,創(chuàng)建結(jié)構(gòu)化、可檢索、可推理的企業(yè)私域知識體系。由此構(gòu)建的高質(zhì)量訓(xùn)練語料,一方面可作為企業(yè)專屬大模型的訓(xùn)練數(shù)據(jù),另一方面依托硅心科技aiXcoder領(lǐng)域化程序分析工具和Agent技術(shù),可以將這些企業(yè)私域知識作為有效的上下文傳遞給大模型,支撐其更好完成軟件開發(fā)任務(wù)。
三、增量預(yù)訓(xùn)練+后訓(xùn)練,訓(xùn)練企業(yè)專屬大模型。硅心科技(aiXcoder)以選定的開源大模型為基礎(chǔ),將高質(zhì)量訓(xùn)練語料轉(zhuǎn)化為模型可學(xué)習(xí)的訓(xùn)練樣本,通過增量預(yù)訓(xùn)練階段,讓模型學(xué)會通信領(lǐng)域知識;通過后訓(xùn)練階段,增強(qiáng)模型執(zhí)行特定任務(wù)的能力。這增強(qiáng)了預(yù)訓(xùn)練模型的性能和適應(yīng)性,使其具備深度的企業(yè)知識理解能力,以及單元測試生成、代碼生成等核心場景的指令遵循和解決問題的能力。
四、以企業(yè)真實數(shù)據(jù)為準(zhǔn),構(gòu)建企業(yè)級測評集。為確保企業(yè)專屬大模型在該通信企業(yè)核心業(yè)務(wù)中的實用價值,硅心科技(aiXcoder)基于企業(yè)內(nèi)部數(shù)據(jù)構(gòu)建訓(xùn)練集和測評集,以真實開發(fā)場景為準(zhǔn)繩,模擬并評估模型在真實企業(yè)環(huán)境中的落地效果,確保企業(yè)專屬大模型從技術(shù)能力到業(yè)務(wù)賦能的全面轉(zhuǎn)化。
挑戰(zhàn)與突破并存,四大技術(shù)創(chuàng)新攻克項目難關(guān)
在推進(jìn)技術(shù)方案落地的過程中,硅心科技(aiXcoder)直面企業(yè)實際需求和項目實施難點,突破行業(yè)常規(guī)做法,以四大創(chuàng)新攻克關(guān)鍵瓶頸:
一、創(chuàng)新采用“大模型+小模型”策略。大模型支持通用場景,比如復(fù)雜的Agent主流程構(gòu)建;小模型支持企業(yè)特定的領(lǐng)域化問題,在解決企業(yè)特定任務(wù)時會更精準(zhǔn)、高效。兩者協(xié)同,既保證通用智能,又強(qiáng)化專業(yè)深度。
二、構(gòu)建全鏈路私域數(shù)據(jù)治理體系。硅心科技(aiXcoder)對“原始需求-設(shè)計-開發(fā)-測試”等各研發(fā)環(huán)節(jié)的企業(yè)數(shù)據(jù)進(jìn)行系統(tǒng)性打通與關(guān)聯(lián)構(gòu)建。由此,當(dāng)模型在執(zhí)行具體任務(wù)時,它不僅能看到當(dāng)前信息和上下文,還能參考研發(fā)全鏈路的相關(guān)信息,獲得全局理解能力,大幅提升輸出結(jié)果的準(zhǔn)確性和實用性。
三、創(chuàng)新融入工作流和Agent技術(shù)。企業(yè)核心業(yè)務(wù)智能化往往需要端到端的解決方案,但目前市場上并沒有能直接解決端到端問題的大模型。為此,硅心科技(aiXcoder)在訓(xùn)練企業(yè)專屬大模型的同時,創(chuàng)造性融入了工作流和Agent技術(shù)。通過精心設(shè)計的任務(wù)編排與Agent協(xié)同,有效補(bǔ)齊端到端的能力短板。
四、利用AI輔助生成高質(zhì)量訓(xùn)練數(shù)據(jù)。企業(yè)內(nèi)部的私域知識和數(shù)據(jù)關(guān)系非常復(fù)雜,且數(shù)據(jù)量不足以支撐模型訓(xùn)練的需求。為此,硅心科技(aiXcoder)在嚴(yán)格遵循業(yè)務(wù)邏輯和安全規(guī)范的前提下,系統(tǒng)梳理和構(gòu)建數(shù)據(jù)間的依賴關(guān)系,并利用大模型合成大量高質(zhì)量、符合業(yè)務(wù)場景的訓(xùn)練數(shù)據(jù),有效解決數(shù)據(jù)瓶頸難題。
應(yīng)用效果:企業(yè)知識問答準(zhǔn)確率69%、代碼生成準(zhǔn)確率45%
據(jù)企業(yè)反饋,企業(yè)專屬大模型應(yīng)用到實際任務(wù)中后,效果超出預(yù)期:企業(yè)知識問答的準(zhǔn)確率由原來51%,提升至69%;代碼生成準(zhǔn)確率由原來的20%,上漲至45%。這顯著提高企業(yè)的軟件開發(fā)效率,使企業(yè)能夠更快響應(yīng)市場需求。
不僅如此,企業(yè)專屬大模型訓(xùn)練過程中所形成的數(shù)據(jù)治理框架、訓(xùn)練路徑和方案都具備高度的可復(fù)用性。隨著底層模型迭代、技術(shù)演進(jìn)和業(yè)務(wù)需求的變化,企業(yè)可以在現(xiàn)有框架上快速適應(yīng)、調(diào)整和新增數(shù)據(jù),大幅降低后續(xù)訓(xùn)練成本,為企業(yè)在長期技術(shù)競爭中構(gòu)建獨特優(yōu)勢。
硅心科技(aiXcoder)在通信行業(yè)的智能研發(fā)實踐,不僅得到了企業(yè)客戶的認(rèn)可,也獲得了行業(yè)機(jī)構(gòu)的高度肯定。在2025全球數(shù)字經(jīng)濟(jì)大會上,aiXcoder“代碼智能體在通信領(lǐng)域的應(yīng)用”方案,獲評“北京市人工智能賦能行業(yè)發(fā)展典型案例”。