在《??低暽疃葘W(xué)習(xí)“文字識(shí)別技術(shù)”國際競(jìng)賽中獲第一》一文中海康憑借OCR(Optical Character Recognition,圖像中文字識(shí)別)技術(shù),刷新了ICDARRobust Reading競(jìng)賽數(shù)據(jù)集的全球最好成績(jī)。在未來這位安防大佬還將繼續(xù)提升OCR技術(shù)性能,并想以此推動(dòng)機(jī)器的智能化和自動(dòng)化水平的提高,應(yīng)用于視頻監(jiān)控、智能感知和場(chǎng)景理解等方面。那么,什么是OCR技術(shù)?應(yīng)用場(chǎng)景有哪些?
OCR智能識(shí)別技術(shù)
OCR智能識(shí)別技術(shù)即是OCR識(shí)別軟件,通過OCR軟件對(duì)圖片中的文字進(jìn)行提取識(shí)別,轉(zhuǎn)換成可檢索的數(shù)據(jù)。但OCR智能識(shí)別技術(shù)其實(shí)分的非常細(xì),下面介紹下OCR智能識(shí)別技術(shù)。
1.證件OC識(shí)別
此類最開始是基于PC的,近幾年開始向移動(dòng)端發(fā)展,主要有android,ios平臺(tái)的SDK,目前成熟的有身份證識(shí)別,行駛證識(shí)別,駕駛證識(shí)別,護(hù)照識(shí)別等。
2.銀行卡OCR識(shí)別
此類技術(shù)是2014年以后開始興起的技術(shù),主要用于移動(dòng)支付綁卡,是一項(xiàng)非常有技術(shù)含量的細(xì)分OCR技術(shù),目前有一些APP已經(jīng)在用,如拉卡拉,宜人貸,支付寶,微信等。
3.名片OCR識(shí)別
這一類技術(shù)也非常成熟了,目前市場(chǎng)上名片管理的APP也非常多,多半已經(jīng)使用這類技術(shù)。
4.文檔OCR識(shí)別
其實(shí)OCR最早的時(shí)候就是主要識(shí)別文檔,主要針對(duì)圖書,報(bào)刊等,把這些紙質(zhì)文檔進(jìn)行電子化。但這類技術(shù)主要是借助在掃描儀的基礎(chǔ)上得到快速發(fā)展,目前識(shí)別率也非常高。移動(dòng)端的文檔OCR識(shí)別,近幾年也有不少成功的應(yīng)用。
5.票據(jù)類OCR識(shí)別
這類技術(shù)主要是針對(duì)各種不同格式的票據(jù),主要基于模板機(jī)制,需要針對(duì)不同的票據(jù),定制不同的識(shí)別要素,這項(xiàng)技術(shù)也稱要素識(shí)別OCR,最早的其實(shí)運(yùn)用的是銀行行業(yè),主要在銀行的后督中,有非常成功的應(yīng)用。
6.手寫OCR識(shí)別
其實(shí)手寫OCR可以分為兩類,一類是書面手寫的識(shí)別,這類技術(shù)沒有得到很好的應(yīng)用,只有是因?yàn)槊總€(gè)人的手寫習(xí)慣不太一樣。目前能識(shí)別好是手寫的數(shù)字和字母,因?yàn)檫@些差異不會(huì)太大,手寫的漢子,難度還是非常大的。第二類是聯(lián)機(jī)手寫技術(shù):聯(lián)機(jī)手寫技術(shù)得到了非常好的應(yīng)用,各種手寫輸入法,都是基于這個(gè)技術(shù)??赡苡行┤藭?huì)問,同時(shí)手寫OCR智能識(shí)別技術(shù),為了聯(lián)機(jī)手寫識(shí)別的非常好,其實(shí)有兩點(diǎn),一是聯(lián)機(jī)手寫是單字識(shí)別,不用做切分,OCR里最難的不是比對(duì)識(shí)別,而是字符切分。二是因?yàn)槁?lián)機(jī)手寫技術(shù)是單字選擇,有人進(jìn)行判斷。所以應(yīng)用的非常廣。
7.車牌OCR識(shí)別
車牌識(shí)別技術(shù)相信大家都不會(huì)覺得陌生,智能交通,小區(qū)停車場(chǎng)等,都有很好的應(yīng)用,車牌識(shí)別的原理其實(shí)技術(shù)對(duì)車牌進(jìn)行OCR識(shí)別,再進(jìn)行比對(duì)的過程。也是相當(dāng)成熟的技術(shù)。
(審核編輯: 林靜)
分享