Så här använder du Tesseract OCR i Java

Innehåll

vägbeskrivning

Tesseract optiska teckenigenkänningsbibliotek erbjuder utvecklare ett sätt att skanna dokument och text till en bild. De brukar lagra bilder av dokument som du inte längre behöver på papper. Du kan använda dem i Java genom att skapa kontrollslingor för varje tecken och skriva var och en till en fil. För att kunna använda Tesseract-biblioteken måste du inkludera Java "namespace" för OCR-funktionerna.

vägbeskrivning

Tesseract-bibliotek tillåter användare att skanna sina dokument (John Foxx / Stockbyte / Getty Images)

Högerklicka på den Java-fil som du vill använda för att skapa OCR-dokumentet. Klicka på "Öppna med" och välj den valfria Java-redigeraren.
Lägg till OCR-bibliotekets namnrymd längst upp i filen. Kopiera och klistra in följande kod till din källfil:

com.tplan.robot.imagecomparison.tesseractocr
Skapa koden som är ansvarig för skanningstecken för en fil. Till exempel skapar följande kod loopar genom varje tecken i en fil och skriver dem till en bildfil:

(I = 1; {i} <{lines} +1; i = {i}) är en uppsättning värden som definieras som: +1) {Typlinje "{_TOCR_LINE {i}}"}
Klicka på "Spara" -knappen på redigeraren och klicka på "Kör" för att köra koden i en Java-kompilator.