OCR到底是個(gè)什么技術(shù)?你了解嗎?
作者:admin
更新時(shí)間:2022-03-22
點(diǎn)擊數(shù):
我們?cè)趯W(xué)習(xí)和辦公的過程中,肯定多多少少遇到過這樣的場(chǎng)景: 在某本書或者某張報(bào)紙上看到一大段有用的文字,想要快速摘錄出來; 查找到的重要信息存儲(chǔ)格式為圖像或者文字不可復(fù)制的PDF,需要手動(dòng)輸入成文本格式; 經(jīng)常需要輸入身份證號(hào)碼或者銀行卡號(hào)碼之類的長(zhǎng)串?dāng)?shù)字,需要仔細(xì)錄入反復(fù)核對(duì); 有大批量的表格、單據(jù)、合同等紙質(zhì)材料需要轉(zhuǎn)化為電子文檔保存; 報(bào)銷發(fā)票時(shí)候需要一張張錄入票據(jù)手動(dòng)計(jì)算金額; ...... 把電子文本轉(zhuǎn)化為圖像很容易,一個(gè)截圖軟件就能做到,但是反過來操作卻是一個(gè)非常艱難的過程。傳統(tǒng)且低效的人工手動(dòng)錄入方式已無法滿足現(xiàn)代快節(jié)奏工作生活的需求,OCR技術(shù)的出現(xiàn),讓我們有了更便利的方式可以代替人工手動(dòng)錄入。 OCR技術(shù)是Optical Character Recognition(光學(xué)字符識(shí)別)的縮寫,是一種通過光學(xué)輸入方式將卡證或者紙質(zhì)文檔上的文字轉(zhuǎn)化為圖像,再利用算法把圖像信息轉(zhuǎn)化為可以用電子設(shè)備進(jìn)行編輯的文本信息的技術(shù)。 簡(jiǎn)單來說,就是一種便捷的圖像轉(zhuǎn)文字的技術(shù)。 現(xiàn)在市面上關(guān)于OCR技術(shù)的應(yīng)用工具有很多,比如文檔識(shí)別、身份證識(shí)別、票據(jù)識(shí)別、名片識(shí)別、銀行卡識(shí)別、車牌識(shí)別......今天我們就以文檔識(shí)別為例,看看OCR技術(shù)是如何工作的。 文檔識(shí)別作為一項(xiàng)成熟的人工智能識(shí)別工具,可以在短時(shí)間內(nèi)識(shí)別和讀取紙質(zhì)文檔信息,并自動(dòng)生成可編輯的電子文檔。此外,文檔識(shí)別還能進(jìn)一步對(duì)電子文檔進(jìn)行糾錯(cuò)、添加備注、存儲(chǔ)、分享等操作。 文檔識(shí)別功能分享: OCR文檔錄入:下載并安裝文檔識(shí)別APP,打開文檔識(shí)別并選擇右下角的“+”號(hào),選擇拍照或是打開手機(jī)內(nèi)的圖像文件,然后選擇(右上角)識(shí)別,獲得文檔識(shí)別結(jié)果。 用戶可以對(duì)識(shí)別結(jié)果標(biāo)題、分組、內(nèi)容、備注等部分進(jìn)行修改,支持自主修改標(biāo)題、自由分組,自動(dòng)校對(duì)糾錯(cuò)、自動(dòng)分行、自助排序。 文檔自由檢索:文檔識(shí)別內(nèi)置全文檢索功能,通過檢索文檔關(guān)鍵字、文件名,就可以快速找到自己需要的電子文檔。 文檔權(quán)限分享:通過聊天工具、Email、社交平臺(tái)分享云盤中的文檔,設(shè)置瀏覽權(quán)限,沒有瀏覽權(quán)限的將無法通過該工具獲取信息。通過設(shè)置閱讀瀏覽權(quán)限,控制文件瀏覽人群,確保文件信息不外泄,保障文件信息安全。 電子圖像美化:在使用文檔識(shí)別APP過程中,需要注意拍攝的文檔圖片不可以過度曝光、不能有深重的陰影,否則會(huì)影響文檔識(shí)別結(jié)果。在OCR識(shí)別過程中,如果遇到圖片模糊(可視范圍)可以通過點(diǎn)擊右下角彩虹色小球,對(duì)即將識(shí)別的文檔進(jìn)行“強(qiáng)化”“美化”處理。通過美化圖像,銳化對(duì)比、降低噪點(diǎn)等方式可獲得更加清晰完整的圖像,使得文字識(shí)別準(zhǔn)確率在各大現(xiàn)實(shí)場(chǎng)景下有明顯提升。