0引 言
? ? ? 甘蔗是我國主要糖料作物之一,2015?年播種面積為?159.965?萬公頃,發(fā)展甘蔗生產是蔗農脫貧致富的重要途徑,良種化種植與機械化耕作是甘蔗產業(yè)發(fā)展的重要手段。甘蔗通過斬種進行種植,目前國內外的甘蔗切割機均不具備莖節(jié)識別功能,切割時經常損傷莖節(jié)處的種芽,導致用種量多、出苗率少,影響甘蔗產量。因此,精確識別甘蔗莖節(jié)處的種芽,實現(xiàn)自動化的蔗種防傷芽切割具有重要意義。
1甘蔗莖節(jié)的識別與定位?
1.1?樣本選取
所選樣品為浙江省優(yōu)質甘蔗生產基地主產的“義紅一號”果蔗。正常品質,在運輸和實驗過程中盡量避免碰撞、擠壓等損傷,去除甘蔗根部表面的泥污,進行高光譜數(shù)據(jù)采集。將?236?個樣本(?莖節(jié)?77?個,莖間?159?個)?隨機分為建模集和預測集,建模集共?177?個,預測集共?59?個。
1.2?高光譜數(shù)據(jù)采集與分析
建立如圖?1?所示的高光譜圖像采集系統(tǒng),該系統(tǒng)主要由光譜儀,計算機,電控移位平臺,相機,鏡頭,線光源和高光譜圖像采集軟件等組成。采集到的高光譜圖像的光譜范圍是?874?~?1734?nm,共?256?個波段,光譜分辨率為?5?nm,采集的高光譜圖像大小為?320?像素?×256?像素。進行高光譜圖像采集時,需要調節(jié)移動平臺的速度、相機曝光時間、鏡頭與光源的間距等參數(shù),確保所獲取圖像清晰且不失真。?經過多次調?校,當?物?鏡?高?度?19?cm,平?臺?移?動?速?度14.5?mm?/?s,曝光時間?4?ms?時,取像效果較佳。在采集箱內完成整個圖像獲取,避免外界光線及其他噪聲干擾。
1.?計算機?2.?數(shù)據(jù)線?3.?光源調節(jié)器?4.?采集箱5.?高度調節(jié)裝置?6.?風扇?7.?相機?8.?光譜儀?9.?鏡頭10.?光源?11.?載物臺?12.?高精度電控移位平臺
圖?1?高光譜圖像采集系統(tǒng)
在采集樣本的高光譜圖像前,需要校正相機暗電流對圖像產生的影響,通過遮住鏡頭獲取黑板校正圖像,采集標準白色校正板得到白板校正圖像,根據(jù)下式計算校正后圖像:
其中,ICorrection表示校正后高光譜圖像,Iraw表示原始圖像,Idark表示全黑標定圖像,Iwhite表示標準白板圖像。數(shù)據(jù)分析在?ENVI?4.6,Matlab?R2012a?和Unscrambler?X10.1?軟件平臺進行。實驗采集甘蔗樣本的近紅外波段,光譜范圍為874?~?1734?nm,原始光譜如圖2?所示。從圖2?可看出,在原始光譜的前后端都有明顯的噪聲干擾,因此采用?995?~?1650?nm?之間的?195?個波段進行數(shù)據(jù)分析與處理較為合適。選取蔗種的莖節(jié)和莖間位置作為研究區(qū)域,并計算它們的光譜平均值,兩個樣本平均光譜曲線如圖?3?所示。由圖?3?可知,莖節(jié)與莖間的光譜曲線具有較大的差異性,兩者的平均光譜在?1170?nm?和?1450?nm?處有明顯的吸收峰。查詢資料可知?1450?nm?是對含水量敏感的波段,由于莖節(jié)與莖間的水分含量不同,它們的平均光譜曲線會在?1450?nm?處顯示吸收峰;在 1170?nm?處?產?生?吸?收?峰?的?原?因?有?待?進?一?步研究。采用主成分分析(?PCA)?對光譜數(shù)據(jù)進行處理,結果如圖?4?所示。第一、二主成分(?PC?-?1,PC?-?2)?的貢獻率分別為?83?%?和?16?%?,累計貢獻率達到?99%?,能夠解釋大部分變量。圖?4?中莖間與莖節(jié)的區(qū)分非常清楚,充分證明高光譜成像技術用于莖節(jié)識別的可行性。
圖?2?甘蔗莖節(jié)和莖間樣本原始光譜圖
圖?3?甘蔗莖節(jié)和莖間樣本平均光譜
圖?4?主成分?PC?-?1?和?PC?-?2?的?PCA?得分
1.3?特征波段提取
甘蔗樣本的高光譜圖像包含?256?個波段,大量的光譜數(shù)據(jù)間存有較大的冗余和共線性信息,增加了特征運算和提取的復雜度.?本文采用連續(xù)投影算法(?SPA)?提取特征波段,該算法利用向量的投影分析,搜尋含有最低限度的冗余信息組,并最小化變量間的共線性,同時能有效減少建模所需變量數(shù),提高建模的速率.?本研究設置?SPA?算法選擇特征波長數(shù)量為?5?~20.采用?SPA?得到?1022?nm,1062?nm,1456?nm,1609?nm?和?1649?nm?這?5?條特征波段,對應的單波段灰度圖像如圖?5?所示,其中?1456?nm?所對應的灰度圖像中莖節(jié)信息非常顯著。對提取的這?5?個波段,采用線性組合的方法進行莖節(jié)的識別與定位。
1.4?甘蔗莖節(jié)識別分類模型的建立
以?SPA?選擇的特征波段為輸入,建立偏最小二乘法?(?PLS)?分類模型.?與傳統(tǒng)多元線性回歸模型相比,PLS?是一種多元統(tǒng)計數(shù)據(jù)分析方法,能夠在自變量存在多重相關性或樣本數(shù)小于變量數(shù)的條件下實現(xiàn)回歸建模;?在最終偏最小二乘回歸模型中將包含原有的自變量,因此更易于識別系統(tǒng)的信息和噪聲,也更容易解釋模型每個自變量的回歸系數(shù).?為了避免過擬合問題,本文?PLS?算法采用全交叉驗證.將?236?個蔗種樣本隨機劃分為校正集(?177個樣本)?和預測集(?59?個樣本)?.?以?SPA?算法挑選的?1022?nm,1062?nm,1456?nm,1609?nm?和1649?nm?這?5?個特征波長為?x?變量,將建模集的類別(?1?代表莖間,2?代表莖節(jié))?作為?y?變量輸入?PLS?模型,得到模型的各個系數(shù)。
圖?5?提取的?5?個特征波段所對應的灰度圖像
建立?PLS模型如下:
采用預測集驗證?PLS?模型,將判斷閾值設為?0.5,即如果輸出結果在(?0.5,1.5?]區(qū)間內,則設置為類別?1;輸出結果在(?1.5,2.5]區(qū)間內,則為類別2。校正集和預測集的判別結果如圖6?所示,縱坐標為?0.5,1.5?和?2.5?處繪制的紅色閾值線。?統(tǒng)計校正集和預測集的誤判數(shù)和準確率,結果如表?1?所示。由表?1?可知,校正集和預測集識別準確率非常高,分別為?99.44%?和?98.31%?,表明所選的?5?個光譜波段基本涵蓋了蔗種莖節(jié)檢測的有效信息,以非常有限的波段數(shù)量簡化了模型。
圖?6?校正集和預測集的判別結果
表?1?PLS?模型檢測結果
1.5莖節(jié)定位
甘蔗莖節(jié)識別分類模型僅實現(xiàn)了蔗種莖節(jié)的定性判別,還需要結合圖像處理技術進一步進行定量分析,從而定位莖節(jié)位置。采用公式①歸一化輸出圖像,輸出結果以0.?5?為閾值進行分類,可成功提取莖節(jié)圖像,具體?過?程?見?圖?7。以?上?處?理?步?驟?都?在?MatlabR2012a?中進行。從圖?7b)?可見,提取的莖節(jié)圖像包含了蔗芽、莖節(jié)和白色噪聲斑點,莖節(jié)為粗細不一的圓弧形,需要在該情況下定位莖節(jié)。?通過分析發(fā)現(xiàn),莖節(jié)在縱向的長度比蔗芽和噪聲斑點要長,因此可以在縱向上統(tǒng)計白色像素數(shù)并繪制統(tǒng)計圖,如圖?8?所示。圖?8?中的?3?個局部最大值分別對應蔗芽、莖節(jié)和噪聲斑點,可以看出莖節(jié)的峰值明顯高于蔗芽和噪聲斑點的峰值,像素最大值所在的位置?(?像素?105?列)?即可設定為莖節(jié)所在的位置。將圖像的最左端定義為起點,建立圖像像素與實際測量尺寸的關系(?像素寬度對應的長度)?,在莖節(jié)最大峰值位置繪制直線,如圖?9?所示,圖中紅線即為莖節(jié)的位置,并設定為?x,以備后續(xù)測量驗證。
圖?8?莖節(jié)、蔗芽和噪聲的像素縱向統(tǒng)計圖
圖?9?莖節(jié)定位示意圖
2圖像識別結果驗證從大量的蔗種中隨機抽取?20?個試驗樣品,樣品采集前,在旁邊放置標尺,結合標尺刻度進行人工測量。?另外,采用本文圖像處理方法測量x?坐標值所對應的位置。兩種方法的測量值如圖?10?所示。通過對圖?10?試驗數(shù)據(jù)的分析可知,采用圖像處理法得到的數(shù)據(jù)與人工測量的數(shù)據(jù)非常接近,莖節(jié)中心?x?的平均絕對誤差為?1.0?mm,標準差為?0.7?mm,絕對誤差最大值為?2.6?mm,完全在可接受的范圍內。本文提取的是甘蔗的莖節(jié)信息,并在識別莖節(jié)的基礎上進行莖節(jié)的定位。通常莖節(jié)的寬度為?9?~?15?mm,將?x?向左右兩端各擴展7.5?mm?作為莖節(jié)的保護范圍,該范圍就包含了種芽,從而為切割蔗種時防傷芽提供保障。不同甘蔗不同位置處的莖節(jié)長度不一,是造成數(shù)據(jù)誤差的主要原因,但是該誤差是可接受的。因此識別定位莖節(jié)的位置可以準確確定蔗芽的范圍,誤差小,可信度高。
圖?10?圖像測量值與人工測量值比較
為了進一步驗證高光譜圖像與普通圖像在識別結果上的差異,采用?CCD?相機直接獲取甘蔗圖像,再使用傳統(tǒng)的圖像處理方法進行圖像處理,即利用莖節(jié)的常態(tài)圖像進行識別,與圖5,圖?7?和圖?8?所示基于高光譜圖像的莖節(jié)識別進行對比,結果如圖?11?所示(?其中第?1?行為原始的普通?RGB?圖像,第?2?行為灰度圖像,第?3行為閾值二值化圖像,第?4?行為每列像素之和的折線圖)?。圖?11a)?莖節(jié)圖像每列像素之和左半邊較小,右半邊較大,無法直接定位莖節(jié)位置;圖?11b)?中的折線圖出現(xiàn)兩個較低的波谷,難以準確識別莖節(jié)位置;圖?11c)?相對較平緩,波谷與莖節(jié)位置有較大的偏差;圖?11d)?與圖11a)?相似,難以準確定位莖節(jié)。?由于莖節(jié)上的白色果粉和其他噪聲的干擾,再加上?RGB?圖像提供的有效信息不多,不能可靠地實現(xiàn)莖節(jié)的識別??梢钥闯?,采用普通圖像的識別效果較差。這也從另一面體現(xiàn)了本文所采用基于高光譜成像技術的甘蔗莖節(jié)識別與定位方法的優(yōu)越性。
?
圖?11?基于普通圖像和傳統(tǒng)圖像處理方法的莖節(jié)識別結果
3結 論
? ? ? ? 本文采用高光譜成像技術對甘蔗莖節(jié)進行定性判別和定量分析。運用?SPA?算法提取莖節(jié)的?5?個特征波段,建立?PLS?判別模型,校正集和預測集的識別率分別為?99.44%?和?98.31%?,對莖節(jié)定性判別效果非常好。運用該模型?5?個敏感波段組合的歸一化圖像進行莖節(jié)識別與定位,定量地檢測出莖節(jié)的位置,其結果的標準差為0.7mm,絕對誤差的最大值為?2.6?mm,并確定了蔗芽的范圍。將該識別模型與定位方法應用于隨機抽取的?20?個樣本,同樣取得良好效果,這為甘蔗莖節(jié)的識別、定位及切割蔗種時防傷芽提供了理論基礎和依據(jù)。
?
評論