什么是手寫識別
編輯手寫識別(HWR),也稱為手寫文本識別(HTR),是計算機從紙質文檔,照片,觸摸屏和其他設備等來源接收和解釋可理解的手寫輸入的能力。可以通過光學掃描(光學字符識別)或智能單詞識別從一張紙上“離線”感知書寫文字的圖像。可替代地,筆尖的移動可以例如通過基于筆的計算機屏幕表面“在線”被感測,這是通常更容易的任務,因為存在更多線索。手寫識別系統可以處理格式,對字符進行正確的分割并找到最合理的單詞。
離線識別
編輯脫機手寫識別涉及將圖像中的文本自動轉換為可在計算機和文本處理應用程序中使用的字母代碼。通過這種形式獲得的數據被視為筆跡的靜態表示。離線手寫識別相對困難,因為不同的人具有不同的手寫風格。并且,到目前為止,OCR引擎主要集中于機器打印的文本和手工“打印”文本的ICR。
傳統技術
字符提取
脫機字符識別通常涉及掃描過去某個時候編寫的表格或文檔。這意味著需要提取掃描圖像中包含的各個字符。存在能夠執行此步驟的工具。但是,此步驟中存在幾個常見的缺陷。最常見的情況是,將連接的字符作為包含兩個字符的單個子圖像返回時。這在識別階段引起了主要問題。還有許多降低連接字符風險的算法。
字符識別
提取單個字符后,將使用識別引擎來識別相應的計算機字符。當前有幾種不同的識別技術。
特征提取
特征提取的工作方式與神經網絡識別器類似。但是,程序員必須手動確定他們認為重要的屬性。這種方法使識別器可以更好地控制識別中使用的屬性。但是,使用這種方法的任何系統都比神經網絡需要更多的開發時間,因為不會自動學習特性。
現代技術
傳統技術著重于對單個字符進行分割以進行識別,而現代技術著重于識別經分割的文本行中的所有字符。特別地,他們專注于能夠學習視覺特征的機器學習技術,從而避免了先前使用的有限特征工程。最先進的方法使用卷積網絡來提取文本行圖像的多個重疊窗口上的視覺特征,RNN使用這些窗口來產生字符概率。
在線識別
編輯在線手寫識別涉及在特殊的數字化儀或PDA上書寫時自動轉換文本,在此傳感器會拾取筆尖的移動以及上/下筆切換。這種數據稱為數字墨水,可以視為手寫的數字表示。所獲得的信號被轉換為可在計算機和文本處理應用程序中使用的字母代碼。
在線手寫識別界面的元素通常包括:
研究
編輯手寫識別擁有活躍的學術研究社區。xxx的手寫識別會議是在偶數年舉行的國際手寫識別領域國際會議(ICFHR)和在奇數年舉行的國際文檔分析和識別會議(ICDAR)。這兩個會議均得到IEEE和IAPR的認可。研究的活躍領域包括:
- 在線識別
- 離線識別
- 簽名驗證
- 郵政地址解釋
- 銀行支票處理
- 作家認可
內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/107582/