摘 要: 當前基于神經網絡方法的車牌字符識別技術都使用固定的訓練樣本,學習的效果受初始樣本限制,對于識別過程中新出現(xiàn)的不同角度、光線等特征的字符圖片不能自適應地學習。本文針對這個問題提出了基于在線序列極限學習機(OS-ELM)的車牌字符識別方法。在樣本實時更新中使系統(tǒng)自適應調整網絡權值,不斷提高識別準確率。本文設計了漢字、字母、字母混合數(shù)字三個字符分類器,根據(jù)車牌字符的排列特征識別相應的字符。通過與傳統(tǒng)ELM方法和BP神經網絡法對比,結果證明該字符識別技術達到了較高的識別率,在訓練速度上也比BP神經網絡法提高了2~3個數(shù)量級。
關鍵詞: 車牌字符識別;極速學習機;在線序列;特征提取
0 引言
車牌識別是智能交通系統(tǒng)(Intelligent Transportation System,ITS)的重要組成部分。在交通擁堵、停車場管理和套牌檢測等眾多領域得到了廣泛的應用。在車牌識別系統(tǒng)中字符識別是核心與難點,目前字符識別方法主要有模板匹配法、神經網絡技術,以及兩者的聯(lián)合應用。
中國大陸車牌字符中含一位漢字且漢字結構復雜,識別困難,出錯率高,模板匹配法對于相似的字符區(qū)分能力差,同時受光線和天氣等復雜情況的影響,在特征數(shù)據(jù)維數(shù)過大時效率較低。神經網絡技術以BP(Back Propagation)算法居多[1-2]。BP神經網絡具有良好的自學習性和存儲知識的能力,但網絡的訓練速度慢,存在局部最優(yōu)解等問題。因而基于該方法的車牌字符識別只能離線訓練樣本,測試精度也較依賴于初始樣本的全面性。
Huang等[3-5]提出了極限學習機(Extreme Learning Machine,ELM),設置合適的隱藏層節(jié)點數(shù),為輸入權值和隱藏層偏差隨機賦值,輸出層權值通過最小二乘法得到,整個過程一次完成,無需迭代,與BP神經網絡相比學習速度顯著提高,于是出現(xiàn)了一些基于ELM及其改進算法的車牌識別方法。Gou Chao等[6]利用ELM算法構建分類器,設計了完整的車牌識別系統(tǒng),取得了較好的分類性能。但是所采用的訓練樣本始終是初始樣本集,對于車牌識別,初始訓練樣本包含全部拍攝角度的車牌字符圖片是比較困難的,所以ELM算法對于新出現(xiàn)的字符樣本沒有學習能力,限制了網絡的魯棒性和泛化能力。因此有必要尋找一種算法,可以將就近識別的樣本加入訓練集,做到實時訓練。
本文設計了基于在線序列極限學習機[7](Online Sequential Extreme Learning Machine,OS-ELM)的車牌識別分類器,能夠在小樣本數(shù)量的基礎上,實時訓練,自適應調整網絡參數(shù),可快速地獲得高識別率。并提出一種新的適合神經網絡結構的特征提取方式,以降低提取特征的維度,滿足車牌識別準確性、魯棒性和實時性要求。
1 車牌字符的特征提取
本文主要采用字符的網格特征和圖像矩陣行列信息作為待識別的字符特征。由于漢字字符筆劃錯綜復雜且分布不均,而字母和數(shù)字字符相對比較簡單,容易提取特征值,因而在提取特征方法的具體實施上兩者有所差別,以便后續(xù)投入不同的分類器。
對漢字的特征提取具體步驟為:
(1)網格特征提取。將歸一化后的漢字字符(大小為32×16)平均劃分成4×4大小相等的子區(qū)域,計算每個子區(qū)域中白色像素值數(shù)量,產生32個網格特征。
(2)行列特征信息提取。從漢字圖像第一行開始,提取第一行中白色像素點的個數(shù),之后將每隔兩行的下一行定為目標行,逐一統(tǒng)計目標行中的白點數(shù)。用同樣方法對圖像矩陣列進行操作。至此,提取出17個行列特征信息值。漢字“浙”的字符特征提取過程示例如圖1。
對于英文字母字符和數(shù)字字符的特征提取,也是采用網格特征結合行列特征的提取方法。但是由于字母、數(shù)字結構簡單,為便于訓練,提取較小維數(shù)的向量作為特征向量。本文提取了16個網格特征和9個行列信息特征共25維特征向量。
2 車牌字符分類器的設計
本文根據(jù)車牌字符的排列特點構造了三個基于OS-ELM的子網絡分類器,分別為漢字字符分類器、字母字符分類器以及字母/數(shù)字混合字符分類器,一方面降低了識別時間,另一方面也提高了識別精度。三種分類器如圖2所示。
分類器配置方面,提取的特征向量維數(shù)即輸入節(jié)點數(shù)目。訓練樣本中漢字字符有14種,分別為魯、京、浙、豫、粵、陜、遼、蘇、吉、瓊、滬、桂、冀、閩;車牌中沒有O和I兩個字母,所以字母有24種,字母加數(shù)字有34種。三種分類器配置如表1。
3 OS-ELM車牌字符識別算法設計
傳統(tǒng)的極限學習機只能學習不變的數(shù)據(jù),而如果初期訓練樣本不能包含全部角度的字符圖片,則新字符圖片由于具有不同角度,以及受遮擋、污跡等影響特殊特征會難以識別,故而限制了網絡的泛化能力。部分特殊特征的字符圖片如圖3所示。
所以本文采用OS-ELM算法,將后繼車牌樣本分批加入訓練,增強網絡的泛化能力,構建基于在線序列極限學習的車牌識別方法。網絡的基本結構如圖4。以漢字分類器設計為例,將提取400張漢字字符圖片特征數(shù)據(jù)均分為4批先后輸入網絡,學習過程如下:
(1)初始化階段。取k=0,其中k為送到網絡的字符數(shù)據(jù)批次。給定激活函數(shù),隱層節(jié)點數(shù)目L和初始訓練數(shù)據(jù)
,其中xi為輸入特征向量,ti為每個特征向量對應的字符類別,N0=100,L由交叉驗證法試驗后取為40。隨機產生輸入權值向量ωj和偏置bj初始化網絡,則由參考文獻[6],輸出權值向量?茁(0)=P0H0TT0。其中:
(2)在線學習階段。給定第k+1批數(shù)據(jù),計算出隱層輸出矩陣為Hk+1,輸出權值向量為:
令k=k+1,返回到在線學習階段,不斷更新參數(shù)H和β,直到學習完4批數(shù)據(jù)。
4 實驗結果及分析
實驗中選取了100幅實際的車牌圖片。用三個OS-ELM分類器進行整體的識別。隱藏層節(jié)點數(shù)目本文用5折交叉驗證法選擇最優(yōu)數(shù)目。識別速度取50次測試結果的平均值。識別結果如表2所示。
本文還將OS-ELM法與已有的ELM法、BP神經網絡的車牌字符識別方法進行了實驗結果的比較。具體比較為:從大量準確分割出的單個字符中選取100張包含字母及數(shù)字的字符圖像作為對比測試樣本,100張作為ELM法和BP神經網絡法的訓練樣本,同時作為OS-ELM訓練樣本的第一批輸入樣本,再選取200張字符圖片分別作為ELM法的第二、第三批訓練樣本。測試結果如表3所示,其中識別結果采取50次識別結果的平均值。
從表2、表3的實驗對比結果可以看出,BP神經網絡算法由于本身繁瑣的迭代過程,因而訓練耗費時間很長。OS-ELM法相比于BP神經網絡法不僅在字符的識別率上表現(xiàn)出了更令人滿意的效果,能達到90%以上,而且在識別速度上更是體現(xiàn)出很大的優(yōu)越性,訓練速度比BP法高出近200倍。與ELM法相比,識別速度相差不多,但有更好的泛化性能。
5 結束語
本文采用在線序列學習機算法對車牌字符進行識別,與BP法相比訓練時間短,能夠滿足在線訓練的要求;與ELM法相比有更好的泛化能力。采用字符的網格特征和圖像矩陣行列信息提取的特征提取方法,降低了特征維數(shù)。針對車牌字符的排列特征,設計了漢字、字母、字母與數(shù)字三個分類器,能夠提高分類準確率并且縮短運算時間。該車牌字符識別技術可以應用于道路監(jiān)控中對實時性要求較高的場合。
參考文獻
[1] KOVAL V, TURCHENKO V, KOCHAN V. Smart license pattern recognition system based on imaging processing using neural network[C]. Procedings of the Second IEEE International Workshop on Intelligent Data Acquisition and Advanced Computing System-technology and Applications. Lviv, Ukraine: IEEE press,2003:123-127.
[2] 劉雄飛,朱盛春.車牌字符多特征提取與BP神經網絡的識別算法[J].計算機仿真,2014,31(10):161-164.
[3] HUANG G B, ZHU Q Y, SIEW C K. Extreme learning machine: theory and applications[J]. Neurocomputing, 2006,70(1):489-501.
[4] HUANG G B, WANG D H, LAN Y. Extreme learning machines: a survey[J]. Intelligent Journal of Machine Learning and Cybernetics, 2011,2(2):107-122.
[5] HUANG G B, ZHOU H M, DING X J, et al. Extreme learning machine for regression and multiclass classification[J]. IEEE Transactions on System, Man, and Cybernetics, 2012,42(2):513-529.
[6] Gou Chao, Wang Kunfeng, Yu Zhongdong. License plate recognition using MSER and HOG based on ELM[C]. IEEE Service Operation and Logistics, and Informatics,2014:217-221.
[7] Liang Nanying, Huang Guangbin, SARATCHANDRAN P, et al. A fast and accurate online sequential learning algorithm for feedforward networks[J]. IEEE Transactions on Neural Networks, 2006,17(6):1411-1423.