Kā lietot Tesseract OCR Java

Autors: Eugene Taylor
Radīšanas Datums: 7 Augusts 2021
Atjaunināšanas Datums: 12 Maijs 2024
Anonim
Kā lietot Tesseract OCR Java - Raksti
Kā lietot Tesseract OCR Java - Raksti

Saturs

Tesseract optiskās rakstzīmju atpazīšanas bibliotēkas piedāvā izstrādātājiem iespēju skenēt dokumentus un tekstu attēlā. Tos izmanto, lai saglabātu dokumentu dokumentus, kas jums vairs nav nepieciešami uz papīra. Jūs varat tos izmantot Java, izveidojot kontroles cilpas katrai rakstzīmei un katram rakstot failu. Lai izmantotu Tesseract bibliotēkas, OCR funkcijām jāiekļauj Java "namespace".


Instrukcijas

Tesseract bibliotēkas ļauj lietotājiem skenēt savus dokumentus (John Foxx / Stockbyte / Getty Images)
  1. Ar peles labo pogu noklikšķiniet uz Java faila, kuru vēlaties izmantot, lai izveidotu OCR dokumentu. Noklikšķiniet uz "Open With" un atlasiet jūsu izvēlēto Java redaktoru.

  2. Pievienojiet faila OCR bibliotēkas nosaukumvietu faila augšdaļā. Kopējiet un ielīmējiet šādu kodu avota failā:

    com.touch.robot.imagecomparison.tesseractocr

  3. Izveidojiet kodu, kas atbild par faila rakstzīmju skenēšanu. Piemēram, šāds kods izveido cilpas ar katru faila rakstzīmi un raksta tās attēlu failā:

    (I = 1; {i} <{līnijas} +1; i = {i}) ir vērtību kopums, kas definēts kā: +1) {Typeline "{_TOCR_LINE {i}}"}

  4. Noklikšķiniet uz redaktora pogas "Saglabāt" un noklikšķiniet uz "Palaist", lai palaistu kodu Java kompilatorā.