Ha szeretne jól informált maradni, iratkozzon fel az OpenKM hírleveire

Az optikai karakterfelismerés

Ana Canteli

Ana Canteli 2022. május 6-án

Az optikai karakterfelismerés eredete a 20. század elejére vezethető vissza, amikor 1914-ben Emanuel Goldberg kifejlesztett egy gépet, amely karaktereket olvas, és azokat szabványos távírókódokká alakította át. A legfigyelemreméltóbb előrelépést azonban csak 1974-ben érte el Ray Kurzweil, aki a betűtípustól függetlenül javította a nyomtatott karakterek optikai felismerését, vakok vagy gyengénlátók olvasógépének létrehozása céljából.

A folyamatos technológiai fejlődés és az eltérő célkitűzések vezettek a ma is használatos OCR technológiához. Kifejlesztésének elsődleges célja a speciális igényű emberek információhoz való hozzáférésének javítása volt, mára azonban már számtalan területen használják világszerte, hogy fokozzák a szervezeti folyamatok hatékonyságát. Jelenleg leginkább az okostelefonokban, intelligens szemüvegekben és az internet kapcsolattal rendelkező eszközökben szerepel, amelyek a beépített kamera segítségével képesek szöveget felismerni és felolvasni.

Ha használt már olyan alkalmazást a telefonján, amely automatikusan lefordítja az idegen nyelven írt jeleket, akkor az OCR-t használ. Sem a tipográfia, sem a nyelv nem jelent már korlátot a technológia számára, sőt a fényviszonyoknak vagy a felbontásnak sem kell optimálisnak lennie.

Létrehozása óta az optikai karakterfelismerő (OCR) technológia olyan kereskedelmi megoldássá vált, amelyet az adatok - mind a nyomtatott szöveg, mind a dokumentum szkennelt képe - automatizálására használnak, hogy azok a számítógép számára olvashatóvá váljanak. Az így nyert adatok hasznosak lesznek a felhasználók számára, akik kereshetnek vagy szerkesztési tevékenységeket végezhetnek.

Az OpenKM dokumentumkezelő rendszer tartalmaz egy optikai karakterfelismerő motort (Tesseract vagy Cuneiform) a felhasználási esetek bővítése és a szervezet által igényelt szoftverfunkciók lehetőségeinek bővítése érdekében.

Az optikai karakterfelismerés előnyei

A Zóna OCR előnyei a következők:

  • Automatizálja az adatbevitelt a rendszerben, így megszüntetheti az adatok kézi bevitelét.
  • Fokozott hatékonyság a megnövekedett adatfeldolgozási kapacitásnak köszönhetően.
  • Megnövekedett hatékonyság a hibacsökkentés révén.
  • Helymegtakarítás az irattár digitalizálásának köszönhetően. 
  • A munkafolyamatok fejlesztése és az olyan folyamatok fejlesztése, mint például: adatrögzítés, indexelés, osztályozás, kategorizálás, fájlterv-kezelés.
  • Költségmegtakarítás, a termelékenység javulása miatt.
  • A szolgáltatás továbbfejlesztése az információkhoz való könnyű és gyors hozzáférésnek köszönhetően.
  • Adattár központosítása.
  • Megbízható biztonságpolitika megvalósítása.

Az optikai karakterfelismerés gyakran rejtett technológia számos üzleti folyamatban, és naponta különféle szolgáltatásokat hajt végre. A digitális képből géppel nyomtatott szöveg kinyerésének lehetősége az adatrögzítésnek csak az egyik aspektusa. Az OpenKM dokumentumkezelő szoftvere képes a különböző formátumú dokumentumokból történő szövegkiemelésre: kézzel nyomtatott szöveg (ICR), jelölőnégyzetek (OMR), vonalkódok stb. Az OpenKM optikai karakterfelismerő rendszere bővítményekkel működik, így a rendszer a kívánt adatbevitel olvasásához igazítható, mint pl.: szöveg, szám, alfanumerikus kód, vagy bármilyen típusú vonalkód stb.

Az OCR technológia másik mindennapi alkalmazása a képformátumú fájlok (jpg, jpeg, png, BMP) automatikus konvertálása PDF-be a jobb használhatóság és a formátumsemlegesség biztosítása érdekében. Ezáltal számos dokumentum, például szerződések, nyugták, számlák és bankszámlakivonatok feldolgozhatók.

Optikai karakterfelismerés működése használat közben

Egy autókölcsönző vállalat valós időben szeretné ellenőrizni az egyes autókölcsönzési műveletek állapotát. Ennek a vállalatnak számos irodája van az ország egész területén. Emellett alapvető információkat tárol egy harmadik féltől származó adatbázisban.

Több OCR-sablon is készült a kapcsolódó járműbérleti dokumentációk kezelésére. Ezek egyike a "forgalmi engedély" sablon.

Az OpenKM-ben szabványként szereplő Zóna OCR-t olyan információk rögzítésére használják, amelyek mindig ugyanazon a helyen jelennek meg és ugyanazoknak a jellemzőknek felelnek meg. Ebben az esetben, amikor az OCR egy adott helyen rendszámtáblát és egy meghatározott helyen jármű-azonosító számot észlel, az OpenKM tudni fogja, hogy ez a dokumentum egy "forgalmi engedély". Az így nyert információt az ügyintézőnek figyelembe kell vennie a további ügyintézésnél.

Ahhoz, hogy az autó bérlése megvalósuljon, egy irodai munkatársnak be kell szkennelnie az összes kötelező dokumentumot, amik között szerepelnie kell a forgalmi engedélynek is. A beolvasott dokumentumok automatikusan az erre a célra kialakított szkenner mappába kerülnek, ezzel az ügyfelet kiszolgáló munkatárs befejezte a feladatát.

Nézzük meg ezt egy példán keresztül: a vállalat ügyfélszolgálatán dolgozunk és kaptunk egy hívást. Feladatunk elvégzéséhez megnyitjuk az OpenKM kereső felületét, ahol kiválasztjuk a Metaadatok fület, ahol a rendszám metaadatcsoportot kiválasztva keressük a szükséges dokumentációt. Első lépésben be kell azonosítanunk, hogy tényleg egy ügyfelünkkel beszélünk-e. Miközben beszélünk behallatszik a telefonba az útról beszűrődő zaj és nem értjük jól minden szavát. Azonban sikerült kihallani a rendszámtábla első két számjegyét, így ellenőrizhetjük, hogy az OpenKM ezekkel az adatokkal milyen információkat tud nekünk adni. A keresési eredmények között megtalálható a forgalmi engedély; így folytathatjuk a szolgáltatást.

Ha a "Metaadatcsoportok megtekintése" lehetőségre kattintunk, láthatjuk, hogy az OpenKM hogyan kezelte a dokumentációt ebben a felhasználási esetben.

Először is átnevezte a dokumentumot a vállalat számára legfontosabb attribútumokkal: a rendszámmal és a dokumentum típusával. (Amikor a dokumentum bekerül az OpenKM-be, az elnevezéséhez automatikusan társul egy kód). A fájlt PDF formátumba is konvertálta, hogy hosszú távú hozzáférést biztosítson az információkhoz.

További információkat is csatolt a dokumentumhoz; a metaadatok csoportjában megjelenik a rendszám, a keretszám és a dokumentumok típusa is. Az optikai karakterfelismerésből származó információ az autó dátuma, márkája, modellje és adóazonosító száma, az OpenKM-be integrált másik adatbázisból származó információ.

Ami azonban a legfontosabb: Hol van ez a dokumentum? A dokumentumkezelő szoftver keresője arra az útvonalra visz minket, amelyen a műveletet lebonyolító hivatal neve alatt a dokumentum automatikusan iktatásra került, és ahol a dokumentum megtalálható, az OpenKM által automatikusan hozzáadott és kitöltött metaadat mező mellett.

Az OpenKM dokumentumkezelő rendszer bármilyen forgatókönyvhöz igazítható. Ha szeretné tudni, hogyan lehet megvalósítani az Ön cégénél is az optikai karakterfelismerés által elérhető fejlesztéseket, keressen minket bizalommal.

Kapcsolatfelvétel

Általános információk