Kā lietot Tesseract OCR Java

Saturs

Instrukcijas

Tesseract optiskās rakstzīmju atpazīšanas bibliotēkas piedāvā izstrādātājiem iespēju skenēt dokumentus un tekstu attēlā. Tos izmanto, lai saglabātu dokumentu dokumentus, kas jums vairs nav nepieciešami uz papīra. Jūs varat tos izmantot Java, izveidojot kontroles cilpas katrai rakstzīmei un katram rakstot failu. Lai izmantotu Tesseract bibliotēkas, OCR funkcijām jāiekļauj Java "namespace".

Instrukcijas

Tesseract bibliotēkas ļauj lietotājiem skenēt savus dokumentus (John Foxx / Stockbyte / Getty Images)

Ar peles labo pogu noklikšķiniet uz Java faila, kuru vēlaties izmantot, lai izveidotu OCR dokumentu. Noklikšķiniet uz "Open With" un atlasiet jūsu izvēlēto Java redaktoru.
Pievienojiet faila OCR bibliotēkas nosaukumvietu faila augšdaļā. Kopējiet un ielīmējiet šādu kodu avota failā:

com.touch.robot.imagecomparison.tesseractocr
Izveidojiet kodu, kas atbild par faila rakstzīmju skenēšanu. Piemēram, šāds kods izveido cilpas ar katru faila rakstzīmi un raksta tās attēlu failā:

(I = 1; {i} <{līnijas} +1; i = {i}) ir vērtību kopums, kas definēts kā: +1) {Typeline "{_TOCR_LINE {i}}"}
Noklikšķiniet uz redaktora pogas "Saglabāt" un noklikšķiniet uz "Palaist", lai palaistu kodu Java kompilatorā.