百川智能正式發(fā)布全鏈路領(lǐng)域增強(qiáng)大模型

來源:環(huán)球網(wǎng)

【環(huán)球網(wǎng)科技綜合報道】12月23日,百川智能發(fā)布全鏈路領(lǐng)域增強(qiáng)大模型Baichuan4-Finance。

如何讓模型在提升專業(yè)能力的同時不損失通用能力,是當(dāng)下大模型落地具體場景最大的阻礙。為解決這一問題,百川智能打造了一套全鏈路領(lǐng)域增強(qiáng)方案,該方案覆蓋了高質(zhì)量數(shù)據(jù)集構(gòu)建、模型預(yù)訓(xùn)練、微調(diào)、強(qiáng)化學(xué)習(xí)等從模型研發(fā)到場景應(yīng)用的全流程。

在模型訓(xùn)練階段,通過領(lǐng)域自約束訓(xùn)練技術(shù),百川智能實現(xiàn)了模型專項能力和通用能力同步提升的效果,極大提升了模型多元場景的可用性。而Baichuan4-Finance正是這一方案的最新成果,全鏈路金融領(lǐng)域增強(qiáng)讓其既掌握了扎實的金融理論基礎(chǔ),又具備了豐富的多場景實踐應(yīng)用能力。

具體而言,Baichuan4-Finance的高質(zhì)量金融數(shù)據(jù)集既包含金融專業(yè)教材與學(xué)術(shù)著作、頂級金融期刊論文、監(jiān)管機(jī)構(gòu)政策文件、金融法律法規(guī)等核心專業(yè)金融知識數(shù)據(jù),也覆蓋了金融專業(yè)問答集、企業(yè)財報與年度報告、金融類研究分析報告等實踐應(yīng)用類數(shù)據(jù),為提升模型金融能力提供了良好的底層支撐。

在此基礎(chǔ)上,Baichuan4-Finance還在領(lǐng)域自約束訓(xùn)練過程中引入了更高精的通用數(shù)據(jù),與高質(zhì)量金融數(shù)據(jù)一起進(jìn)行混合訓(xùn)練,最終實現(xiàn)了模型通用能力不下降,金融能力穩(wěn)定增長的效果。

此外,百川智能在后訓(xùn)練環(huán)節(jié)也做了大量增強(qiáng)工作,如:通過合成數(shù)據(jù)、指令數(shù)據(jù)對模型進(jìn)行有監(jiān)督的微調(diào);在強(qiáng)化學(xué)習(xí)策略中,針對數(shù)學(xué)計算等金融領(lǐng)域特別關(guān)注的場景進(jìn)行樣本增強(qiáng)等,進(jìn)一步提升了模型性能。

值得一提的是,為了更好地助力金融企業(yè)將大模型應(yīng)用到各種真實場景,百川智能還在官網(wǎng)發(fā)布了Baichuan4-Finance全鏈路領(lǐng)域增強(qiáng)的技術(shù)報告,詳細(xì)闡述了包括“領(lǐng)域自約束訓(xùn)練”在內(nèi)的各項技術(shù)細(xì)節(jié)。(青云)

標(biāo)題:百川智能正式發(fā)布全鏈路領(lǐng)域增強(qiáng)大模型

地址:http://www.17168cn.cn/anmoyi/375845.html