人臉識(shí)別圖像預(yù)處理 [人臉識(shí)別中的圖像預(yù)處理技術(shù)]
發(fā)布時(shí)間:2020-02-16 來(lái)源: 感悟愛(ài)情 點(diǎn)擊:
摘要:人臉作為一種高普遍性、非接觸式采集的重要生物特征,正被越來(lái)越多地用來(lái)進(jìn)行身份鑒別。本文介紹了人臉識(shí)別的基本過(guò)程,簡(jiǎn)要分析了人臉識(shí)別中的圖像預(yù)處理技術(shù),如直方圖變換、線(xiàn)性濾波、非線(xiàn)性濾波、圖像變換,并在MATLAB中實(shí)現(xiàn)。
關(guān)鍵詞: 人臉識(shí)別;傅里葉變換;中值濾波;圖像處理;MATLAB
中圖分類(lèi)號(hào):TP391.4 文獻(xiàn)標(biāo)識(shí)碼:A
1引言
人臉識(shí)別,特指利用分析比較人臉視覺(jué)特征信息進(jìn)行身份鑒別的計(jì)算機(jī)技術(shù)。人臉識(shí)別技術(shù)應(yīng)用廣泛,可用于安全驗(yàn)證系統(tǒng)、醫(yī)學(xué)、檔案管理、銀行和海關(guān)的監(jiān)控系統(tǒng)及自動(dòng)門(mén)禁系統(tǒng)等[1]。與利用指紋、虹膜等其他人體生物特征進(jìn)行身份識(shí)別的方法相比,人臉識(shí)別更加友好、方便和隱蔽。因其巨大的應(yīng)用前景,以及其無(wú)可比擬的優(yōu)越性,人臉識(shí)別越來(lái)越成為當(dāng)前模式識(shí)別和人工智能領(lǐng)域的一個(gè)熱點(diǎn)。圖像預(yù)處理是人臉識(shí)別過(guò)程中的一個(gè)重要環(huán)節(jié)。輸入圖像由于圖像采集環(huán)境的不同,往往存在有噪聲,對(duì)比度不夠等缺點(diǎn)。為了保證人臉圖像中人臉大小、位置以及人臉圖像質(zhì)量的一致性,必須對(duì)圖像進(jìn)行預(yù)處理。
2人臉識(shí)別的基本內(nèi)容和過(guò)程
人臉識(shí)別(Face Recognition)一般可描述為:給定一靜止或動(dòng)態(tài)圖像,利用已有的人臉數(shù)據(jù)庫(kù)來(lái)確認(rèn)圖像中的一個(gè)或多個(gè)人。從廣義上講,其研究?jī)?nèi)容包括以下五個(gè)方面:
(1)人臉檢測(cè)(Face Detection):即從各種不同的場(chǎng)景中檢測(cè)出人臉的存在并確定其位置。這一任務(wù)主要受光照、噪聲、頭部?jī)A斜度以及各種遮擋的影響。
(2)人臉表征(Face Representation):即確定表示檢測(cè)出的人臉和數(shù)據(jù)庫(kù)中的己知人臉的描述方式。通常的表示方法包括幾何特征(如歐氏距離、曲率、角度等)、代數(shù)特征(如矩陣特征矢量)、固定特征模板、特征臉、云紋圖等。
(3)人臉鑒別(Face identification):即通常所說(shuō)的人臉識(shí)別,就是將待識(shí)別的人臉與數(shù)據(jù)庫(kù)中的已知人臉比較,得出相關(guān)信息。這一過(guò)程的核心是選擇適當(dāng)?shù)娜四槺硎痉绞脚c匹配策略。
(4)表情分析(Facial expression Analysis):即對(duì)待識(shí)別人臉的表情進(jìn)行分析,并對(duì)其加以分類(lèi)。
(5)物理分類(lèi)(Physical Classification):即對(duì)待識(shí)別人臉的物理特征進(jìn)行分類(lèi),得出其年齡、性別、種族等相關(guān)信息。
人臉識(shí)別的基本過(guò)程和框架如圖1所示。
人臉圖像采集預(yù)處理特征提取識(shí)別
預(yù)處理模塊主要完成人臉圖像質(zhì)量的改善,包括提高圖像對(duì)比度、消除噪聲等,可視具體應(yīng)用而選用。特征提取模塊完成提取人臉特征,如何提取穩(wěn)定和有效的特征是識(shí)別系統(tǒng)成敗的關(guān)鍵。本文將分析人臉識(shí)別中涉及的圖像處理技術(shù)。
3人臉識(shí)別中的圖像預(yù)處理技術(shù)
預(yù)處理的目的是為了提高圖像質(zhì)量、加強(qiáng)有用的信息。常用的預(yù)處理有姿態(tài)矯正、光照補(bǔ)償、尺寸歸一化、去噪、邊界增強(qiáng)、提高對(duì)比度等,它是一項(xiàng)基礎(chǔ)性工作,可在人臉特征提取之前根據(jù)需要有選擇地進(jìn)行適當(dāng)?shù)念A(yù)處理操作。本文采用直方圖均衡技術(shù)進(jìn)行人臉圖像的預(yù)處理,主要目的是增強(qiáng)對(duì)比度,提高圖像質(zhì)量。
3.1直方圖均衡技術(shù)
3.1.1直方圖定義
直方圖是圖像的一種統(tǒng)計(jì)表達(dá)。對(duì)一幅灰度圖像,其灰度統(tǒng)計(jì)直方圖反映了該圖中不同灰度級(jí)出現(xiàn)的統(tǒng)計(jì)情況[2]。其定義為:
P(sk)=nk/N
其中nk表示圖像的第k級(jí)灰度值,N表示像素總數(shù)。直方圖能給出該圖像的整體描述,例如圖像的灰度范圍、每個(gè)灰度級(jí)的頻度和灰度的分布、整幅圖像的平均明暗和對(duì)比度。直方圖又分為直方圖均衡化和直方圖規(guī)定化。
3.1.2直方圖均衡技術(shù)
直方圖均衡化也叫直方圖均勻化,就是把給定圖像的直方圖分布改變成均勻分布的直方圖,它是一種常用的灰度增強(qiáng)方法[3]。本文在MATLAB環(huán)境下對(duì)采集后的圖像進(jìn)行了圖像的預(yù)處理,見(jiàn)圖2。
圖2(a)較暗,有些細(xì)節(jié)不夠清晰,反映在直方圖上就是其直方圖所占據(jù)的灰度范圍分布在較窄的區(qū)間,引起圖像細(xì)節(jié)不清楚。圖2(b)和圖2(c)分別為對(duì)原始圖像進(jìn)行直方圖均衡化得到的結(jié)果及其對(duì)應(yīng)的直方圖,由圖2(c)可見(jiàn)均衡化后直方圖占據(jù)了整個(gè)灰度值允許的范圍,圖像的灰度間距拉開(kāi),灰度分布均勻,從而增大了反差,使圖像細(xì)節(jié)清晰,達(dá)到了圖像增強(qiáng)的目的。
3.2線(xiàn)性平滑濾波
均值濾波也稱(chēng)為線(xiàn)性濾波,其采用的主要方法為鄰域平均法、超限像素平滑法和加權(quán)均值濾波法。這里以鄰域平均法為例進(jìn)行說(shuō)明。鄰域平均法,其基本原理是用均值替代原圖像中的各個(gè)像素值,即對(duì)待處理的當(dāng)前像素點(diǎn) (x,y)選擇一個(gè)模板(圖3所示為一均值濾波模板)求模板中所有像素的均值,再把該均值賦予當(dāng)前像素點(diǎn) (x,y),作為處理后圖像在該點(diǎn)上的灰度g(x,y)。模板運(yùn)算的基本步驟為:將模板在圖像中漫游,并將模板中心與圖像中的某個(gè)像素位置重合;將模板上系數(shù)與模板下對(duì)應(yīng)的像素相乘;將所有乘積加起來(lái);將和(模板的輸出響應(yīng))賦給圖像中對(duì)應(yīng)模板中心位置的像素。圖4所示為在MATLAB中對(duì)含噪圖像圖4(a)進(jìn)行均值濾波的效果圖,從圖4(b)中可以發(fā)現(xiàn)達(dá)到了去噪效果。
3.3非線(xiàn)性平滑濾波
非線(xiàn)性平滑濾波的典型方法為中值濾波。中值濾波器的基本原理是把數(shù)字圖像或數(shù)字序列中一點(diǎn)的值用該點(diǎn)的一個(gè)鄰域中各點(diǎn)值的中值代替,讓周?chē)袼鼗叶戎档牟畋容^大的像素改取與周?chē)南袼刂到咏闹,從而可以消除孤立的噪聲點(diǎn)。圖5所示為在MATLAB中采用不同的中值濾波模板對(duì)含噪圖像如圖5(a)進(jìn)行中值濾波的效果圖。對(duì)比5圖(b)和(c)可以得到,5*5的模板去噪效果比3*3的模板效果好。
3.4圖像變換
圖像變換就是把圖像從空間域轉(zhuǎn)換到變換域(如頻率域)的過(guò)程。將圖像轉(zhuǎn)換到新的空間,顯現(xiàn)出一些新的特性,方便特征提取,使圖像處理過(guò)程更加簡(jiǎn)單有效。圖像變換的方法很多,如:離散傅里葉變換、離散余弦變換、哈達(dá)瑪變換、小波變換等。其中傅里葉變換是一種較為典型的頻域變換技術(shù)。利用二維離散快速傅里葉變換將人臉圖像從空間域變換到頻率域后,較為復(fù)雜的人臉圖像可以簡(jiǎn)單地用振幅譜來(lái)表征,人臉圖像在頻率域中,計(jì)算簡(jiǎn)便,能量相對(duì)集中。
在變換域中實(shí)現(xiàn)圖像增強(qiáng)的步驟如下:
。1)計(jì)算需增強(qiáng)的圖像的傅里葉變換F(u,v);
(2)將其與一個(gè)(根據(jù)需要設(shè)計(jì)的)轉(zhuǎn)移函數(shù)H(u,v)相乘;
。3)再將結(jié)果G(u,v)傅立葉反變換得到增強(qiáng)的圖像。
以傅里葉變換為例,介紹其在頻域中實(shí)現(xiàn)平滑濾波。在MATLAB中實(shí)現(xiàn)從空域到變換域的代碼如下:
f=fft2(image);%將image圖像進(jìn)行快速傅里葉變換
g=fftshift(f);% 將傅里葉變換結(jié)果進(jìn)行移中
由于邊緣和噪聲都對(duì)應(yīng)圖像傅里葉頻譜中的高頻部分,所以通過(guò)在頻域中的低通濾波可以除去或消弱噪聲的影響。要實(shí)現(xiàn)低通濾波首先需要選擇一個(gè)合適的轉(zhuǎn)移函數(shù)H(u,v)。在諸多低通濾波器中,Buterworth低通濾波器“振鈴”現(xiàn)象不明顯,而且能夠提高圖像的細(xì)節(jié)清晰度,這里以Buterworth低通濾波器為例對(duì)圖像進(jìn)行平滑濾波。一個(gè)階為n,截?cái)囝l率為D0的巴特沃斯低通濾波器的轉(zhuǎn)移函數(shù)為:
H(u,v)=11+[D(u,v)/D0]2n待處理圖像如圖6(a)所示,從該圖中可以看出圖像中有噪聲的干擾,Buterworth低通濾波器設(shè)置如下:n=3,截?cái)囝l率為20。圖6(b)所示為低通濾波效果圖。
對(duì)比圖6(a)和(b)可以發(fā)現(xiàn),Buterworth低通濾波器對(duì)噪聲的濾除效果很好,不過(guò)同時(shí)也使圖像變得模糊了。
4總結(jié)
人臉識(shí)別具有無(wú)可比擬的優(yōu)越性,近幾十年來(lái)得到飛速發(fā)展,比如近年來(lái)出現(xiàn)了基于近紅外圖像的人臉識(shí)別,許多有效實(shí)用的人臉識(shí)別系統(tǒng)也脫穎而出,并且被廣泛應(yīng)用于海關(guān)、機(jī)場(chǎng)、金融機(jī)構(gòu)等安全性要求較高的重要場(chǎng)所。人臉識(shí)別有著廣闊的應(yīng)用前景,不僅是模式識(shí)別、計(jì)算機(jī)視覺(jué)和人工智能等領(lǐng)域的一個(gè)熱門(mén)的研究課題,同時(shí),人臉識(shí)別又是一個(gè)難度極大的課題,如人臉識(shí)別中的光照問(wèn)題,姿態(tài)問(wèn)題,表情問(wèn)題等,這也是作者進(jìn)一步研究的重點(diǎn)。
參考文獻(xiàn)
。1]董火明,高雋,汪榮貴.多分類(lèi)器融合的人臉識(shí)別與身份認(rèn)證[J].系統(tǒng)仿真學(xué)報(bào), 2004(8).
[2]章毓晉.圖像處理(第二版)[M].北京:清華大學(xué)出版社,2006.
。3]張宏林. 數(shù)字圖像模式識(shí)別技術(shù)及工程實(shí)踐[M].北京:人民郵電出版社,2003.
。ū疚膶徃鍎c祥)
相關(guān)熱詞搜索:預(yù)處理 識(shí)別 圖像 人臉識(shí)別中的圖像預(yù)處理技術(shù) 圖像文本識(shí)別預(yù)處理 圖像預(yù)處理基本步驟
熱點(diǎn)文章閱讀