AI繪畫(huà)能分圖層了?超越傳統(tǒng)摳圖,一經(jīng)公布收獲大量關(guān)注

如今AI繪畫(huà)技術(shù)的發(fā)展已經(jīng)取得了令人矚目的進(jìn)步,普通的用戶只需輸入文本文句就能輸出具體獨(dú)特風(fēng)格和想象力的圖像。而近期一項(xiàng)最新的研究,似乎又使得AI在圖像處理方面迎來(lái)新的突破,那就是可以直接生成單個(gè)或多個(gè)透明圖層,也就是其能夠?qū)崿F(xiàn)圖像分圖層的功能,它的出現(xiàn)超越了傳統(tǒng)的摳圖技術(shù),并在公布之后引發(fā)了廣泛的關(guān)注和討論。

這項(xiàng)技術(shù)名為:LayerDiffusion,它是由之前ControlNet的作者LvminZhang發(fā)布的新工具。在講述這項(xiàng)技術(shù)之前有必要為大家簡(jiǎn)單介紹一下它背后的作者,因?yàn)樗那耙粋€(gè)作品也為AI繪畫(huà)提供了關(guān)鍵性的技術(shù)突破。在StableDiffusion誕生之初,盡管普通人可以通過(guò)簡(jiǎn)單輸入文本就可以輸出高質(zhì)量的圖片,但隨著大量樣本的加入,種種的問(wèn)題也隨之暴露而出。雖然模型本身非常的強(qiáng)大,但生成的圖像往往不那么受用戶控制,想生成一張高質(zhì)量可以使用的圖片往往需要大量天花亂墜的關(guān)鍵詞來(lái)進(jìn)行限制,而普通用戶面臨的首要問(wèn)題就是無(wú)法找出合適的關(guān)鍵詞。

那ControlNet的出現(xiàn)就很好的解決了這一個(gè)問(wèn)題,它可以直接提前輸入畫(huà)面的構(gòu)圖、姿勢(shì)等畫(huà)面的深度信息,有了它的幫助,就不需要頻繁的用關(guān)鍵詞碰運(yùn)氣式的抽卡操作,那些手指等其他關(guān)鍵點(diǎn)的問(wèn)題也迎面而解。具體深度的發(fā)展過(guò)程這里我們就不細(xì)講了,后面有機(jī)會(huì)我們也會(huì)向大家科普一下這位在AI繪畫(huà)領(lǐng)域中貢獻(xiàn)頗多的大神作者。

聊回LayerDiffusion,這個(gè)項(xiàng)目和ControlNet一樣,解決了文生圖中比較實(shí)際的問(wèn)題,那就是生成了透明的4通道RGBA圖像,其效果絲毫不遜色于那些商業(yè)摳圖的成果。除了可以生成單個(gè)的透明圖像以外,還能生成多層的圖像,分離開(kāi)圖像的元素和背景,這正是每一位作圖或者摳圖人士夢(mèng)寐以求的理想工具。

LayerDiffusion利用大型預(yù)訓(xùn)練的潛在擴(kuò)散模型(latentdiffusionmodel)來(lái)創(chuàng)造透明圖像。這項(xiàng)技術(shù)不僅可以生成單獨(dú)的透明圖像,還能生成多層透明圖層。LayerDiffusion項(xiàng)目已經(jīng)在forge的擴(kuò)展上可以使用,經(jīng)過(guò)測(cè)試,其功能強(qiáng)大,不僅支持直接生成透明的圖片元素,還可以在已有圖片上生成與環(huán)境融合的透明圖片。網(wǎng)上就曾有過(guò)研究調(diào)查,大多數(shù)的情況下,相比于之前的臨時(shí)解決方案(例如先生成圖像再進(jìn)行摳圖的處理),大多數(shù)人更喜歡直接生成的透明內(nèi)容。

傳統(tǒng)的摳圖技術(shù)通常是基于顏色、紋理等特征進(jìn)行分割,但這種方法往往會(huì)產(chǎn)生邊緣不清晰、細(xì)節(jié)丟失等問(wèn)題,尤其在處理那些半透明效果(如火焰、煙霧)或復(fù)雜邊緣時(shí)遇到困難。而這項(xiàng)技術(shù)則可以通過(guò)深度學(xué)習(xí)模型對(duì)圖像進(jìn)行更加精細(xì)的分析,識(shí)別出圖像中不同層次的物體和背景,并將它們分別繪制在不同的圖層上。這種分圖層的技術(shù)不僅可以提高圖像處理的效率,還可以保留更多的細(xì)節(jié)和信息,使得處理后的圖像更加逼真和自然。

盡管目前該技術(shù)的模型和部分代碼已經(jīng)開(kāi)源,但仍然處于研究和商業(yè)化階段。即便是在還未成熟的情況下,這一技術(shù)也已經(jīng)引發(fā)了大量的關(guān)注和討論。人們對(duì)于AI在圖像處理領(lǐng)域的潛力充滿了好奇和期待,他們希望能夠看到更多類似的創(chuàng)新技術(shù)問(wèn)世,以進(jìn)一步提升圖像處理的水平和效率。

除了在圖像處理領(lǐng)域,該技術(shù)的應(yīng)用還可能延伸到其他領(lǐng)域,如動(dòng)畫(huà)制作、游戲開(kāi)發(fā)、虛擬現(xiàn)實(shí)等。例如,在動(dòng)畫(huà)制作中,通過(guò)AI繪畫(huà)技術(shù)可以更加快速和精確地繪制角色和背景,提高制作效率和質(zhì)量;在游戲開(kāi)發(fā)中,可以利用AI繪畫(huà)技術(shù)實(shí)現(xiàn)更加逼真和細(xì)致的場(chǎng)景和角色設(shè)計(jì),提升游戲體驗(yàn)。

感興趣的小伙伴們可以前往作者的官網(wǎng)去了解更多的內(nèi)容,也別忘了下載一個(gè)StableDiffusion親自去體驗(yàn)下,當(dāng)然這對(duì)于配置的要求可不低,沒(méi)有一張性能強(qiáng)悍的顯卡怎么行!全新影馳GeForceRTX 40 SUPER系列GPU,在AI工作負(fù)載方面,GeForceRTX 4080 SUPER生成視頻的速度比RTX3080 Ti快1.5倍,生成圖像的速度比RTX3080 Ti快1.7倍。作為在PC上體驗(yàn)AI最佳的顯卡系列,專用AITensor Core可提供高達(dá)836AI TOPS,在游戲、創(chuàng)作和日常工作等方面提供革命性的AI性能。

(8592273)

標(biāo)題:AI繪畫(huà)能分圖層了?超越傳統(tǒng)摳圖,一經(jīng)公布收獲大量關(guān)注

地址:http://www.17168cn.cn/bigualu/137263.html