騰訊宣布混元文生圖大模型開源

來源:環(huán)球網(wǎng)

【環(huán)球網(wǎng)科技報(bào)道 記者 李文瑤】5月14日,騰訊宣布旗下的混元文生圖大模型全面升級(jí)并對(duì)外開源,目前已在 Hugging Face 平臺(tái)及 Github 上發(fā)布,包含模型權(quán)重、推理代碼、模型算法等完整模型,可供企業(yè)與個(gè)人開發(fā)者免費(fèi)商用。

據(jù)了解,這是業(yè)內(nèi)首個(gè)中文原生的DiT架構(gòu)文生圖開源模型,支持中英文雙語輸入及理解,參數(shù)量15億。升級(jí)后的混元文生圖大模型采用了與 sora 一致的DiT架構(gòu),不僅可支持文生圖,也可作為視頻等多模態(tài)視覺生成的基礎(chǔ)。

升級(jí)后的混元文生圖模型采用了基于Transformer的擴(kuò)散模型架構(gòu)(簡(jiǎn)稱DiT),具備更強(qiáng)的可擴(kuò)展性,在參數(shù)量越多的情況下,性能越強(qiáng),有利于提升視覺模型生成效果及效率。這也是此前爆紅的文生視頻產(chǎn)品Sora 背后的關(guān)鍵技術(shù)。

騰訊文生圖負(fù)責(zé)人蘆清林表示:“騰訊混元文生圖的研發(fā)思路就是實(shí)用,堅(jiān)持從實(shí)踐中來,到實(shí)踐中去。此次把最新一代模型完整開源出來,是希望與行業(yè)共享騰訊在文生圖領(lǐng)域的實(shí)踐經(jīng)驗(yàn)和研究成果,共建中文文生圖開源生態(tài),加速大模型行業(yè)發(fā)展?!?/p>

目前,騰訊混元文生圖模型參數(shù)量達(dá) 15 億。評(píng)測(cè)數(shù)據(jù)顯示,最新的騰訊混元文生圖模型效果相比前代提升超過 20%,遠(yuǎn)超開源的Stable Diffusion模型,在目前已開源的文生圖模型中,綜合性能最佳,達(dá)到國(guó)際領(lǐng)先水平。

標(biāo)題:騰訊宣布混元文生圖大模型開源

地址:http://www.17168cn.cn/xiyiji/192172.html