互億無線 · 文檔中心

OCR識別 - 常見問題


什么是OCR?
OCR(Optical Character Recognition),即光學(xué)字符識別,是一項先進技術(shù)。它通過掃描等光學(xué)手段,將各類票據(jù)、報刊、書籍、文稿以及其他印刷品中的文字轉(zhuǎn)換為圖像信息。隨后,利用文字識別技術(shù),這些圖像信息被轉(zhuǎn)化為可以電子化處理的格式,方便計算機輸入和使用。

文字識別功能能識別哪些內(nèi)容?
基于深度學(xué)習(xí)技術(shù)的文字識別(OCR)可以智能地將圖片中的文字內(nèi)容轉(zhuǎn)換為可編輯的文本格式。此技術(shù)支持多種場景下的通用文字、卡證文字、票據(jù)單據(jù)等印刷體和手寫體文字的識別。此外,它還包括票據(jù)核驗功能,有效替代傳統(tǒng)的人工錄入方式,極大提升工作效率。

接入文字識別OCR服務(wù),需要開發(fā)編程能力嗎?
接入文字識別OCR服務(wù)需要一定的編程開發(fā)能力。用戶需進行二次開發(fā)對接,并通過調(diào)用API接口,實現(xiàn)從圖片或掃描件中提取文字并轉(zhuǎn)換為可編輯文本的功能。識別提取后的結(jié)果需通過編程技術(shù)與用戶的業(yè)務(wù)系統(tǒng)相結(jié)合,或保存為TXT、Excel等文件格式。

我購買了通用印刷體識別資源包,各版本接口都可以使用嗎?
不可以。通用印刷體識別、通用印刷體識別(高速版)和通用印刷體識別(高精度版)是三個獨立的接口,各自的資源包不能混用。若您購買的是通用印刷體識別資源包,則僅限于該接口的使用。

文字識別OCR有哪些應(yīng)用場景?
OCR技術(shù)廣泛應(yīng)用于多個領(lǐng)域:它能自動識別圖片或視頻幀中的關(guān)鍵文字信息,使信息搜索與審核更加迅速和精準(zhǔn),極大地提升信息分發(fā)與管理水平。同時,OCR技術(shù)還可用于文檔電子化,如辦公文件、合同文檔、法律卷宗等,通過識別這些紙質(zhì)文檔中的文字信息,便于文件的保存、分類和檢索。

怎么提高識別的準(zhǔn)確率和識別速度?
提高文字識別的準(zhǔn)確率和速度,需注意以下幾點:確保拍攝光照、背景和清晰度適宜。建議上傳JPG格式的圖片,且文件大小不超過1M。在采集圖片時,盡可能放大要識別的文字區(qū)域,保證文字清晰可辨。適當(dāng)壓縮圖片大小,也能有效縮短識別時間。

文字識別是否支持方向旋轉(zhuǎn)/不同朝向的圖片文字識別?
大多數(shù)文字識別能力已經(jīng)支持圖像方向的自動校正,可以正確識別旋轉(zhuǎn)的圖片中的文字。

文字識別是否可以批量識別?
目前,文字識別技術(shù)不支持批量識別。每次調(diào)用只能識別單張圖片,但您可以在QPS允許的范圍內(nèi)進行多線程調(diào)用。

可以識別PDF、Word、Excel等格式文件嗎?
目前支持JPG、JPEG、BMP、TIF、WebP等圖片格式及PDF文檔的識別,但暫不支持Word、Excel等格式。如需識別這些格式的文本,可先將其轉(zhuǎn)換為圖片或PDF格式后再進行上傳。

為什么文字識別結(jié)果不準(zhǔn)確?
文字識別結(jié)果不準(zhǔn)確可能有多種原因:圖片尺寸過小,低于15px;圖片畫質(zhì)差,如過暗、內(nèi)容不清晰;文字內(nèi)容被水印、印章或褶皺等遮擋;圖片樣式與接口支持類型不符,如身份證識別僅支持二代居民身份證。如遇錯誤碼,請參考相應(yīng)的錯誤碼進行問題排查。

身份證OCR是如何收費的?
身份證OCR的收費是按照調(diào)用接口的次數(shù)計算的。例如,若識別身份證的正反面各一次,則計費為兩次。具體價格詳情,請參閱我們的產(chǎn)品定價信息。

文字識別返回的文字類型和存儲方式是什么?
識別完成后,返回的結(jié)果是JSON格式的字符串。用戶可以根據(jù)需要選擇不同的存儲方式。

現(xiàn)在注冊,即享新用戶禮包!

在線咨詢
電話咨詢

服務(wù)熱線:

4008 808 898

服務(wù)熱線(工作時間):

4008 808 898

業(yè)務(wù)咨詢(非工作時間):

售后咨詢(非工作時間):

驗證碼已發(fā)送到您的手機,請查收!

輸入驗證碼后,點擊“開通體驗賬戶”按鈕可立即開通體驗賬戶。

收不到短信驗證碼?
互億無線不提供接碼服務(wù),接碼用戶請勿點擊開通按鈕。
×