在NeurIPS 2022上,南洋理工大學-商湯科技聯(lián)合研究中心S-Lab提出了一種基于VQGAN+Transformer的人臉復原模型CodeFormer,效果是真的強大。

CodeFormer由一個專家研究人員和工程師團隊開發(fā),利用了基于transformer的架構(gòu)和注意力機制的新穎組合,這使它有別于其前輩。

transformer架構(gòu)允許CodeFormer捕捉圖像中的遠程相關(guān)性,使其特別擅長重建可能因年齡或損傷而丟失的復雜面部特征。

此外,CodeFormer采用自我注意機制,使模型能夠?qū)W⒂诿娌康南嚓P(guān)區(qū)域,并強調(diào)恢復過程中的關(guān)鍵元素。這種注意力驅(qū)動的方法確保最關(guān)鍵的細節(jié),如眼睛、嘴唇和面部輪廓,被準確地重建,從而產(chǎn)生非常逼真和視覺上吸引人的結(jié)果。

CodeFormer主要特點:

  • CodeFormer是一個強大的人工智能工具,用于恢復舊圖像和生成逼真的人工智能面孔,利用基于變壓器的架構(gòu)和注意力機制。

  • CodeFormer的深度學習功能通過增強顏色、恢復面部細節(jié)和減少噪音來恢復歷史照片的活力,保留珍貴的記憶。

  • 通過CodeFormer的用戶友好界面,預處理圖像、選擇目標、自定義設(shè)置并獲得令人驚嘆的結(jié)果,輕松恢復舊照片。

  • CodeFormer的高級transformer架構(gòu)允許它通過在不同的數(shù)據(jù)集上進行訓練和微調(diào)設(shè)置來生成高度逼真的AI人臉,以獲得獨特的結(jié)果。

  • 負責任地使用和監(jiān)管人工智能生成的人臉對于避免deepfakes等潛在問題至關(guān)重要,確保該技術(shù)服務于積極和道德的目的。

  • 人工智能生成的人臉在各個領(lǐng)域都有應用,從視頻游戲和電影到虛擬現(xiàn)實,通過栩栩如生的角色和化身來豐富視覺內(nèi)容。

  • CodeFormer代表了人臉恢復和人工智能生成人臉的重大進步,負責任的利用將為具有積極社會影響的光明未來鋪平道路。

CodeFormer安裝環(huán)境準備

python:官網(wǎng)下載地址:https://www.python.org/downloads/

git:官網(wǎng)下載地址:https://git-scm.com/

conda官網(wǎng)下載地址:https://www.anaconda.com/products/distribution

Pytorch >= 1.7.1。官網(wǎng)地址:https://pytorch.org/

CUDA >= 10.1。英偉達獨立顯卡,cuda引擎大于10.1。否則只能通過cpu解碼(CPU解碼性能弱于GPU)

安裝python、git、conda

安裝python注意點:

pyghon一定不能最新版,不要高于3.10.9版本,教程使用3.10.9成功安裝。

運行.exe程序后,一定勾選add .exe to path。把python添加到環(huán)境變量,如果不勾選,安裝后就需要資源配置環(huán)境變量。

python安裝成功后,cmd命令行輸入python –version會顯示版本信息。

安裝conda注意點:

安裝好后需要自己配置環(huán)境變量?;蛘咴诎惭b過程勾選加入環(huán)境變量,不過我發(fā)現(xiàn)勾選后會紅字提示可能出問題,所以沒有勾選。網(wǎng)上有直接勾選的可以試試。成功后,在cmd輸入conda –version會顯示版本信息。

CodeFormer開源項目地址

https://github.com/sczhou/CodeFormer