手機(jī)對比度對焦,也稱為反差對焦,這種對焦方法有非常嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)推導(dǎo)的,在下因?yàn)槭枪た粕瑪?shù)學(xué)功底不好,只能做非常粗略的介紹,詳細(xì)的內(nèi)容還要依靠更有能力的知友來實(shí)現(xiàn)。
一般來說基于圖像處理的自動對焦的方法有兩種,第一種是通過計(jì)算對焦深度得到的,第二種是通過計(jì)算離焦深度得到的。
這兩種方法的原理說明起來比較麻煩,簡單來說,離焦深度方法是從離焦圖像中獲得模糊程度和深度信息,根據(jù)二者加上對應(yīng)的拍攝參數(shù)來計(jì)算清晰度評價值,并結(jié)合這些所有值,得到需要調(diào)整的具體量,因?yàn)樾枰膱D像較少,所以速度較快。
對焦深度方法要麻煩一些,首先需要一系列模糊程度不同的圖像,計(jì)算這一系列圖像的清晰度評價值,之后對這一系列值以擬合的方式得到評價曲線,根據(jù)評價曲線的峰值確定最佳對焦位置,這種方法精度高,但速度慢。
需要說一點(diǎn)題外話就是,雖然這個些過程一樣,但不同的廠商的計(jì)算方法其實(shí)有些不同,所以一樣的對比度對焦,有的廠家就收斂就快,有的廠家就則慢。
這兩種方法都不離開一個東西,就是清晰度評價值,清晰度評價值類似一個統(tǒng)計(jì)量,是根據(jù)一些參數(shù)經(jīng)過某種處理之后得到的,當(dāng)然清晰度評價值還有其他的要求,比如有效性/魯棒性等。
平常計(jì)算清晰度評價值的方法一般有這么幾種(不全面,還有其他的很多):
第一種是頻譜函數(shù)的方法,清晰的圖像對比相應(yīng)的不清晰圖像在相應(yīng)頻譜分量上含有更多的信息,一種反映出來就是頻譜函數(shù)的幅值,可以利用這種方法評價。
第二種是信息熵,清晰的圖像的信息熵大于相應(yīng)的不清晰圖像,這個原始證明很繁瑣,所以這里用數(shù)據(jù)處理定理反證:1.清晰的圖像處理后可以得到不清晰的圖像。 2.但不清晰的圖像無論如何處理都不能單獨(dú)得到清晰的圖像。 3.所以清晰圖像的信息熵大于相應(yīng)的不清晰圖像,如果有方法計(jì)算出信息熵,則可以用熵來評價。
第三種是梯度函數(shù),在圖像中梯度函數(shù)是一個可以衡量某變量變換率快慢的函數(shù),正確對焦的圖像有較為清晰的邊緣,而在邊緣的地方更為銳利,往往有變化率的最大值,或者說變化最不連續(xù),如此一來也可以評價清晰度。
現(xiàn)在常用的是第三種,也就是梯度,梯度在數(shù)學(xué)上是變換率的表征,在實(shí)際計(jì)算的時候我們可以用方差、能量梯度或者拉普拉斯算子(等價于二階微分)或者其他一些方法來實(shí)現(xiàn),這些計(jì)算方法本身各自的復(fù)雜度不同,但最影響計(jì)算量的是選取圖像中像素點(diǎn)的多寡,比如一個對比度對焦選款,是取中央一點(diǎn),還是邊緣四點(diǎn),還是對角線五點(diǎn)?這都是各個相機(jī)廠家考慮的問題。
現(xiàn)在來看看,下圖是那種評價方法?