作者:彩譜科技
本研究應用了400-1000nm的高光譜相機,可采用杭州彩譜科技有限公司產品FS13進行相關研究。光譜范圍在400-1000nm,波長分辨率優(yōu)于2.5nm,可達1200個光譜通道。采集速度全譜段可達128FPS,波段選擇后最高3300Hz(支持多區(qū)域波段選擇)。
大米是我國主要糧食產品之一,不同產地大米的口感與營養(yǎng)價值具有較大差異,而大米在外觀及品質方面用肉眼難以鑒別,使得低質高價、混淆真?zhèn)巍a地造假的現象日益嚴重,傳統(tǒng)方法例如感官識別、近紅外光譜、礦物質元素等都有一定的劣勢與不足。如感官評價不僅對從業(yè)人員有很高的經驗要求,且容易受主觀影響而錯判;近紅外光譜方法需要對大米進行粉碎處理;礦物質元素方法實驗繁瑣且周期長,均無法滿足快速無損的產地確證需求。
高光譜圖像技術結合機器學習方法是近年來應用比較廣泛的農產品無損檢測技術,因其高效、準確、穩(wěn)定的特點被廣泛應用于農產品的產地確證,本文選取吉林省梅河口市水稻主產區(qū)大米與非梅河產區(qū)大米作為樣本數據,經高光譜數據采集后對數據進行 MSC、SVN、S-G預處理;對預處理后數據利用CARS、MDS、PCA三種方法進行數據降維;最后為迎合高光譜數據中所包含的大量非線性數據,選取MLP、ELM、OS-ELM、PLS算法進行分類模型的建立,并與傳統(tǒng)方法PLS對比,得到結論如下∶
(1)MSC、SVN、S-G 三種預處理方法均可對高光譜數據進行預處理,但經模型實際驗證后發(fā)現,經SVN、S-G處理后的光譜數據對模型準確率均存在一定的負影響,所以本文選擇MSC對后續(xù)實驗數據進行預處理。
(2)CARS、MDS、PCA三種方法均可有效的對預處理后高光譜數據進行降維處理,其中CARS提取了15個特征波長,MDS提取了13個特征波長,PCA提取了9個特征波長,其中基于PCA降維后數據建立的四種模型分類準確率有明顯下降,其中PCA-PLS準確率已經下降到66.5%;基于CARS方法降維后數據建立的四種模型準確率亦有所下降,但基本控制在10%左右,其中OS-ELM模型分類準確率可達到88.1%;基于MDS降維后數據建立的四種模型準確率下降均在1.3%以內,其中MDS-OS-ELM分類準確率最高可達到97%以上,而輸入變量減少了96%,大大提升了模型運行效率。
(3)以經 MDS 降維后數據作為基礎,對 MLP、ELM、OS-ELM、PLS 四種模型訓練效率進行對比分析,結果表明∶在一次性輸入所有數據時,ELM與OS-ELM模型訓練時間相近且明顯優(yōu)于MLP與PLS。優(yōu)于在實際應用中通常不能一次性獲取所有數據,本文將500條數據分5次輸入ELM與OS-ELM模型,由于OS-ELM在新加入數據時只需訓練新的樣本,避免反復學習的特點,使得在分批次加入數據時,大大提升了模型效率,
(4)本文通過高光譜成像技術獲取不同產地大米數據,在經數據預處理與降維處理后利用MLP、ELM、OS-ELM、PLS模型進行分類,經試驗表明,四種模型均可實現對大米產地鑒別,其中MDS-OS-ELM模型分類性能最好,模型效率最高,以及在后續(xù)分批次添加數據時模型效率更加明顯。滿足了快速無損的大米產地確證需求,在大數據背景下的地標大米產地確證領域更具有實用性。