《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 設計應用 > 基于ARM和Linux的字符采集與識別系統
基于ARM和Linux的字符采集與識別系統
維庫開發網
摘要: 提出了一種針對嵌入式系統的字符識別方法。介紹了一種基于ARM9處理器和嵌入式L inux 的字符圖像采集與識別系統。該系統采用嵌入式Linux操作系統, 圖像預處理和字符識別的軟件開發可以脫離硬件。通過開發不同的識別軟件, 系統可應用于名片識別、二維條碼識別、紙幣序列號識別等多種字符識別的場合, 提高了通用性。
關鍵詞: ARM Linux 字符采集
Abstract:
Key words :

傳統紙質讀物的數字化以及諸如條碼識別等字符識別系統都離不開圖像的讀入與識別, 然而目前廣泛使用的字符識別設備將這兩部分獨立開, 即由圖像讀入設備(如掃描儀)和安裝于計算機上的識別軟件構成, 但這樣的設備構成離不開安裝識別軟件的計算機, 造成成本上升和使用不便。隨著電子產品的普及, 具有攝像功能的電子產品及其上的識別軟件也可以構成一個字符識別系統, 但是這種識別系統的識別速度受到攝像頭調焦的限制, 難以廣泛應用。文中提出的便攜式字符采集和識別系統, 其硬件平臺是基于接觸式圖像傳感器( C IS) 與ARM9處理器S3C2410,軟件平臺是基于嵌入式L inux 系統, 可以克服以上兩種設備的缺點, 同時滿足方便性和快速性的要求。另一方面, 由于設備基于L inux 操作系統, 使得識別軟件的開發和擴展可以脫離硬件, 大大提高識別系統的通用性。

1.圖像采集模塊

字符識別系統主要由圖像采集模塊和圖像處理模塊組成, 其中圖像采集模塊是整個系統的硬件核心,圖像采集的質量直接影響系統的整體性能。線陣C IS每次掃描得到一行像素值, 配合運動平臺的縱向運動可以完成一幅二維圖像的掃描。為保證圖像采集的質量, 必須精確控制運動平臺與C IS 之間的工作匹配, 本系統以CPLD 作為圖像采集模塊的控制核心,CIS傳感器、步進電機、ADC 以及高速緩存FIFO 在CPLD的控制協調下完成一幅圖像的采集、模數轉換和數據緩存。系統總體結構框圖如圖1所示。

圖1系統結構框圖。

1.1硬件平臺

( 1)ARM 處理器。

采用三星公司的ARM9系列S3C2410A 作為處理器, 工作頻率可達203MH z, 片上資源豐富, 可以滿足實時性要求, 為圖像處理提供運行平臺并配合CPLD 完成圖像采集模塊的邏輯和讀寫控制。

( 2)圖像傳感器及運動平臺。

接觸式圖像傳感器( C IS) 具有體積小、重量輕、功耗低、結構緊湊、連接方便以及無阱深等優點, 在掃描儀等領域被廣泛應用。本系統采用SV643C10型C IS, 其物理分辨率600 dpi( 236 do t /mm ) , 有效掃描寬度292mm, 共688個傳感器像素單元, 其像素輸出頻率為5MH z。

運動平臺由步進電機和光電傳感器等組成, 光電傳感器實現對進紙的檢測, 啟動掃描。步進電機控制掃描件換行, 配合C IS完成圖像的采集。

( 3)信號調理電路。

信號調理電路完成對C IS 輸出模擬信號的差分、放大等, 實現降噪和電壓匹配的作用。

( 4)高速A /D轉換器。

由于C IS的像素輸出頻率高于處理器內部的A /D轉換器, 所以本系統采用高速的外部ADC 器件TLC5540, 其最大采樣率40 MB s- 1, 擁有8 位分辨率。

( 5)數據緩存。

為了實現ADC 和ARM 的速度匹配, 提高系統工作效率, 在ADC 與ARM 處理器之間加一個F IFO 存儲器作為高速數據緩存, 選用Averlog ic公司的1 MB8 bit的AL4V8M 440。

( 6) CPLD模塊。

實現圖像采集模塊的邏輯控制。為C IS傳感器提供的時鐘信號CP 和行轉移信號SP。為ADC 提供采集時鐘, 為FIFO 提供讀寫控制和寫時鐘等。

( 7)存儲器。

本系統采用三星公司的64 MB NAND Flash 存儲器K 9F1208作為程序和數據的存儲單元, 采用兩片16位的HY57V561620CT- H (總容量64MB ) SDRAM作為系統內存, 同時作為DMA 方式讀取緩存數據的目的存儲器。其中Flash存儲器存儲空間分配情況如圖2所示。

圖2NAND Flash地址分配。

1.2軟件設計

圖像采集模塊的程序設計主要任務是實現該模塊各元器件的協調工作以及實現對圖像數據的讀取。主要分為3部分內容。

( 1) CPLD 上的邏輯設計。采用VHDL 語言編寫,該程序將外部晶振的10MH z輸入進行分頻, 為C IS、ADC、FIFO 等提供時鐘和控制信號, 并為步進電機提供工作時序。

( 2)嵌入式L inux 系統的裁剪、配置和移植。

本系統采用26內核, 宿主機環境為Ubuntu804。

圖3L inux內核配置。

( 3) L inux 驅動程序的編寫。由于采集模塊對于Linux系統來說可看作為一個設備, 因此該部分程序應作為嵌入式L inux 設備驅動程序來編寫, 該驅動程序通過CPLD間接實現采集模塊的邏輯控制和圖像數據的讀取, 為應用程序的開發提供底層硬件的接口[ 5 ] 。從FIFO 緩存讀取圖像數據采用DMA 方式,DMA的目的存儲器為ARM 系統的SDRAM。

圖像采集模塊工作流程圖和圖像采集效果分別如圖4和圖5所示。

2.圖像識別模塊

本文的目的是構建一個通用的字符識別系統,圖像采集模塊實現了對掃描件圖像數據的獲取。由于系統基于嵌入式L inux, 使得后續的圖像處理與字符識別軟件設計可以脫離硬件系統獨立進行, 具有較高的通用性, 可以根據實際應用場合開發和擴展不同的識別軟件, 本文僅探討手寫體數字識別的應用。

識別算法:

線性判別分析( L inearity D istinct ion Analysis,LDA)是有效的特征抽取方法之一, 廣泛用于人臉識別和字符識別等領域[ 6] 。其基本思想是選擇使F isher準則函數達到極值的一組矢量作為最佳投影方向, 樣本在該矢量集上投影后, 達到最大的類間離散度和最小的類內離散度。為找到投影軸, 應最大化類間離散矩陣Sb 和類內離散矩陣Sw 的比值:

類間離散矩陣Sb 和類內離散矩陣Sw 的定義為

其中, c表示為模式的類別數; j 表示為第j 類的均值(其概率為pj ); 0 為全部樣本均值; xji 為第j 類模式i的h維向量; nj 是第j 類的樣本數; N 是所有樣本數。j 和0 定義為:

最優化問題可以通過Sb 和Sw 的特征值的求解而獲得。如果在樣本離散矩陣中非目標樣本占有比重較大, LDA 并不能保證找到最優子空間。LDA 的最優分類標準并不一定對分類準確性最優, 有可能使得已經分開的鄰近類引起不必要的重迭。本文采用一種新的加權LDA 方法( ILDA ), 其計算S^b 和S^w 方法如下:

顯然, 如果( )是個常數, 在投影方向上, S^b和S^w 分別等同Sb 和Sw。如果每一類的( )是不同的, 這將對臨近類的重迭樣本的分類產生影響??梢钥闯? 如果 ij較大, 則( )較小。

實驗樣本取自手寫體通用數據庫UC I, 在Bhattacharyya距離( BD)分類器下對加權線性判別分析與相應的算法進行實驗比較和分析, 取得較好的識別性能, 證實了該方法提取的特征的有效性。

3.結束語

本文采用嵌入式Linux 和ARM 處理器軟硬件平臺, 利用C IS傳感器配合運動平臺實現了圖像的采集和存儲, 為嵌入式字符識別系統構建了一個圖像采集平臺。在字符識別的應用方面, 探討了廣泛應用的手寫數字識別算法, 在已有的線性判別分析算法基礎上, 提出了一種改進的加權線性判別分析算法, 并對該算法進行了實驗驗證, 獲得了較好的識別率。

此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 中文字幕视频免费在线观看 | 日韩毛片欧美一级国产毛片 | 免费看成人毛片日本久久 | 在线视频欧美日韩 | 九九色视频在线观看 | 欧美日韩精品一区二区免费看 | 男女交性拍拍拍高清视频 | 最新怡红院全部视频在线 | 久久欧美久久欧美精品 | 亚洲网站免费观看 | 国产一区二区三区欧美 | 日韩国产精品欧美一区二区 | 国产精品高清在线观看地址 | 在线中文字日产幕 | 91热久久免费频精品动漫99 | 久草在线网站 | 日韩中文字幕网 | cao美女 | 久久一区二区三区不卡 | 一级毛片在线播放免费 | 欧美精品亚洲一区二区在线播放 | 亚洲人成综合网站在线 | 中文字幕亚洲综合久久男男 | 白白在线观看永久免费视频 | 性生大片一级毛片免费观看 | 欧美激情毛片裸推荐 | 成年人三级黄色片 | 一级毛片情侣 | 国产乱码精品一区二区三区四川人 | 精品久久久久不卡无毒 | 国产亚洲欧洲一区二区三区 | 亚洲欧美大片 | 国产aaa女人十八毛片 | 久草视频福利在线观看 | 国产精品亚洲一区二区三区久久 | 一级亚洲| 久久国内精品自在自线观看 | 亚洲成a人在线观看 | 波多野结衣在线观看一区二区三区 | 乱码在线中文字幕加勒比 | 91日本在线观看亚洲精品 |