OCR

OCR er optisk tegngjenkjenning eller også kjent på spansk som optisk karaktergjenkjenning . OCR er en programvare som muliggjør tekstgjenkjenning, og produserer et bilde av den for å transformere den til en rekke karakterer, og deretter lagre dem i et gitt format, som kan brukes i disse tekstredigeringsprogrammene. Med andre ord, takket være denne nye teknologien, kan enhver type tekst eller dokument, som inkluderer PDF-filer, skannede papirer eller til og med bilder tatt fra digitale kameraer, konverteres til data slik at det har mulighet for å bli redigert.

OCR

Denne programvaren fungerer som følger, først analysere hver del av bildet av det aktuelle dokumentet ; distribuerer siden i deler som tabeller, bilder, tekstblokker, blant andre; så blir linjene fordelt i ord for senere å bli tegn; og siden karakterene allerede er blitt påpekt, gjør programvaren sammenligningen med en gruppe bilder av mønsteret. Dette fortsetter i henhold til serien med hypoteser om hva hver karakter er ; og basert på disse hypotesene, analyserer han de forskjellige variantene av linjeskift i ord og ord i karakterer. Og det er etter et stort antall hypotesen analyse og prosessering at programmet endelig presenterer teksten som allerede er anerkjent og transformert i et nytt format .

Det skal bemerkes at det i dag er en rekke programmer som datamaskinmarkedet tilbyr basert på OCR som OmniPage, Abbyy Fine Reader eller READiris . ÅÅ at de har kapasitet, ikke bare til å analysere og gjenkjenne en tekst som sådan, men også til å gjenkjenne format og stil, men med visse begrensninger, og dermed krever at teksten, etter å ha blitt analysert, redigeres for å gjøre de justeringene som kreves. påkrevd.

Anbefalt

Vídeo
2020
autarchy
2020
miljø
2020