基于高光譜圖像技術(shù)的隱形字快速識別研究
基于高光譜圖像技術(shù)的隱形字快速識別研究
四川雙利合譜科技有限公司-黃宇
[導(dǎo)讀] 有名作家、詩人、評論家、政論家、學(xué)者高爾基曾利用牛奶在白紙上寫字,待白紙風(fēng)干后,字跡也隨之消失,從而達(dá)到隱形傳遞消息的目的。那怎樣恢復(fù)白紙上的字跡呢?根據(jù)史書記載,將白紙用火烤一下,字跡就會慢慢的變得清晰起來,這是因為牛奶中含有蛋白質(zhì),而蛋白質(zhì)在60攝氏度左右變性,凝固,顯現(xiàn)出來,而紙的燃點達(dá)到130度以上,因此用火烤一下可以使牛奶字跡清晰。但是用飽和鹽水、眼液、淀粉水在白紙上寫字,待白紙風(fēng)干后,字跡消失了,然而利用火烤的方法卻無法將白紙上的字跡識別出來。因此需要借助其他辦法來快速識別任何液體書寫的隱形字跡。
基于高光譜圖像技術(shù)的隱形字快速識別研究
1. 試驗材料
將牛奶、飽和鹽水、眼液分別在白色A4紙上寫上字,待溶液曬干后利用短波紅外相機(jī)(1000nm-2500nm)對其分別進(jìn)行測試,獲取其在短波紅外波段的高光譜圖像和光譜信息。SWIR短波紅外相機(jī)光譜分辨率為8-10nm,像素為384x288,波段數(shù)為288個。測試設(shè)備及SWIR短波紅外相機(jī)如圖1所示。
圖1 測試設(shè)備及SWIR短波紅外相機(jī)
基于高光譜圖像技術(shù)的隱形字快速識別研究
2. 數(shù)據(jù)預(yù)處理
對獲取的高光譜圖像數(shù)據(jù)進(jìn)行黑白幀校正得到圖像的光譜反射率數(shù)據(jù),同時對反射率數(shù)據(jù)進(jìn)行壞點(NAN)進(jìn)行修復(fù),剔除掉異常值,從而得到牛奶、飽和鹽水、眼液及背景(白紙)的光譜反射率數(shù)據(jù),如圖2所示。從圖2可知,干牛奶與未干牛奶,其在白紙上寫的字跡光譜反射率差異較大;當(dāng)牛奶曬干后,字跡的光譜反射率與白紙十分相似,變化規(guī)律也趨向一致,對光譜進(jìn)行放大分析可知,牛奶字跡的光譜反射率總體上高于白紙的光譜反射率。對于飽和鹽水字跡而言,干飽和鹽水字跡與未干飽和鹽水字跡在光譜反射率上差異較為明顯,特別是在水汽吸收帶1420 nm和1910 nm附近差異更為顯著;當(dāng)飽和鹽水曬干后,飽和鹽水字跡的光譜反射率與白紙的光譜反射率變化趨勢一致,但是白紙的光譜反射率高于飽和鹽水字跡的光譜反射率。運用眼液在白紙上寫上字,待眼液曬干后,去牛奶字跡、鹽水字跡一樣,肉眼無法識別出是什么字,利用短波紅外相機(jī)測試其光譜反射率發(fā)現(xiàn),眼液曬干后,其字跡的光譜反射率與白紙的光譜反射率變化趨勢依然一致,但是眼液字跡的光譜反射率高于白紙的光譜反射率。
圖2 牛奶、飽和鹽水、眼液及背景(白紙)的光譜反射率
3. *小噪聲分離變換
由于高光譜遙感數(shù)據(jù)波段多,波段間存在很大相關(guān)性,為了克服維數(shù)災(zāi)難,利用*小噪聲分離變換進(jìn)行波段選擇,達(dá)到優(yōu)化數(shù)據(jù),去除噪聲和數(shù)據(jù)降維的目的。
*小噪聲分離變換( MNF)是對主成分變換( PCA) 的一種改進(jìn)方法。PCA 是一種線性變換,變換后各主成分分量彼此之間互不相關(guān),隨著主成分的增加該分量包含的信息量減小,**主成分包含的信息量*大,**主成分與**主成分無關(guān)且在剩余成分中包含的信息量*大,依此類推。但PCA對噪聲比較敏感,在變換后的主成分分量中,信息量大的信噪比不一定高,當(dāng)某個信息量大的主成分中包含的噪聲的方差大于信號的方差時,該主成分分量形成的圖像質(zhì)量就差。針對 PCA 變換的不足,Green 和 Berman 提出*小噪聲分離變換( MNF),它不但能判定圖像數(shù)據(jù)內(nèi)在的維數(shù)( 波段數(shù)) ,分離數(shù)據(jù)中的噪聲,而且能減少隨后處理中的計算需求量。MNF 變換是基于圖像質(zhì)量的線性變換,變換結(jié)果的成分按照信噪比從大到小排列。經(jīng)過MNF變換大部分噪聲集中在特征小的分量中。而不像 PCA變換按照方差由大到小排列,從而克服了噪聲對影像質(zhì)量的影響。
3.1 牛奶隱形字特征識別
圖3列舉了牛奶隱形字原圖(手機(jī)拍攝)、MNF變換前5個成分。從圖中可知原圖看不到任何字跡模樣,但經(jīng)過MNF變換后,第1、2、3、4成分能較好地識別出隱形字跡,其中第2成分隱形字跡識別效果*佳。第1成分中隱形字較亮的部分是因為牛奶尚未完全風(fēng)干,第2成分隱形字較亮、較暗的部分同樣是因為牛奶尚未完成風(fēng)干,導(dǎo)致MNF變換中其信息較為顯著,如圖2可知干牛奶區(qū)域和未干牛奶區(qū)域的光譜反射率曲線差異較為顯著。第3、4、5成分隱形字的灰度不完全一致,也是因為牛奶未完全風(fēng)干的原因。
圖3 牛奶隱形字原圖及MNF前5個成分
基于高光譜圖像技術(shù)的隱形字快速識別研究
3.2 飽和鹽水隱形字特征識別
圖4列舉了飽和鹽水隱形字原圖(手機(jī)拍攝)、MNF變換前5個成分。從圖中可知原圖看不到字跡模樣,但經(jīng)過MNF變換后,第1、3成分能較好地識別出隱形字跡,其中第1成分隱形字跡識別效果*佳。第2、4、5以及往后的成分均無法識別出飽和鹽水的字跡。第1成分中隱形字較亮的部分和第3成分隱形字較暗部分是因為牛奶尚未完全風(fēng)干的原因,從圖2可知干飽和鹽水區(qū)域和未飽和鹽水區(qū)域的光譜反射率曲線差異較為顯著。
圖4飽和鹽水隱形字原圖及MNF前5個成分
3.3 眼液隱形字特征識別
圖5列舉了眼液隱形字原圖(手機(jī)拍攝)、MNF變換前5個成分。從原圖中依然無法看到隱形字跡,但經(jīng)過MNF變換后,第1成分能較好地識別出隱形字跡,第2、3、4、5以及往后的成分均無法識別眼液書寫的字跡。
圖5眼液隱形字原圖及MNF前5個成分
4. 基于高光譜圖像技術(shù)的隱形字快速識別研究總結(jié)
針對高光譜數(shù)據(jù)信息量豐富,但數(shù)據(jù)冗余且包含噪聲的特點,本文基于*小噪聲分離變換算法有效地對不同液體書寫的隱形字高光譜圖像進(jìn)行降維處理,分離了圖像中的有效信息和噪聲,減小了后期處理的數(shù)據(jù)量,提高了數(shù)據(jù)處理效率。通過對隱形字高光譜數(shù)據(jù)進(jìn)行*小噪聲分離變換,從而清晰地識別出了隱形字體,實驗結(jié)果對于文物考古、刑偵領(lǐng)域識別隱形字跡提供了參考和借鑒。
此分析報告所有權(quán)歸四川雙利合譜科技有限公司所有,盜用必究。如想了解更多成像高光譜技術(shù)報告、學(xué)習(xí)高光譜遙感知識,請關(guān)注微信訂閱號:遙感技術(shù)及應(yīng)用服務(wù)。