智能字符識別
編輯在計算機科學中,智能字符識別(ICR)是一種先進的光學字符識別(OCR)或更確切地說是手寫識別系統,該系統允許計算機在處理過程中學習字體和不同樣式的筆跡,以提高準確性和識別水平。
能力
編輯大多數智能字符識別軟件都有一個稱為神經網絡的自學習系統,它會自動為新的手寫模式更新識別數據庫。從打印字符識別(OCR的功能)到手寫體識別,它擴展了掃描設備在文檔處理方面的實用性。由于此過程涉及手寫識別,因此在某些情況下,準確性級別可能不是很好,但是在以結構形式閱讀手寫內容時可以達到97%+的準確性。通常,為了達到這些高識別率,在軟件中使用了多個讀取引擎,每個讀取引擎都具有選擇性的投票權,可以確定字符的真實讀取。在數字字段中,旨在讀取數字的引擎優先,而在alpha字段中,旨在讀取手寫字母的引擎具有更高的選拔權。后臺系統避免了繁瑣的手動鍵入操作,并且比傳統的人工數據輸入更為準確。
自動化表格處理
智能字符識別的一項重要發展是約瑟夫·科科倫(Joseph Corcoran)在1993年發明了自動表格處理技術,該發明獲得了專利。這涉及三個階段的過程:捕獲要由ICR處理的表單的圖像,并準備使其能夠使ICR引擎提供最佳結果,然后使用ICR引擎捕獲信息,最后處理結果以自動驗證輸出來自ICR引擎。
智能字符識別的這種應用增加了該技術的實用性,并使其可用于常規業務應用程序中的現實世界形式。現代軟件應用程序將ICR用作識別手工填寫(手工打印)形式的文本的技術。
智能單詞識別
編輯智能文字識別(IWR)不僅可以識別和提取印刷的手寫信息,還可以識別和提取草書。智能字符識別在字符級別進行識別,而IWR則使用完整的單詞或短語。據說IWR能夠從每天的頁面中捕獲非結構化信息,它比手印ICR更具發展性。
IWR并不是要取代傳統的ICR和OCR系統,而是針對處理現實世界中的文檔進行了優化,這些文檔主要包含固有形式不適合智能字符識別的自由格式,難以識別的數據字段。這意味著IWR的最大和最佳用途是消除手動輸入的手寫數據和手動打印字段中的很大一部分,否則只能由人來鍵入。
內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/107592/