Als u papierloos gaat werken, heeft u een eenvoudige manier nodig om uw gescande documenten doorzoekbaar te maken, zodat ze meer zijn dan alleen maar statische afbeeldingen van uw papieren documenten. We hebben al gekeken naar manieren om OCR-documenten te gebruiken in apps zoals Adobe Acrobat, PDFPen en Google Drive. Hoewel elk van deze apps tekst in uw documenten kan herkennen, is dit niet hun primaire functie.
Misschien wel een van de bekendste OCR-ontwikkelaars is ABBYY, dat veel verschillende papierloze beheerprogramma's produceert. In deze zelfstudie laat ik u zien hoe u hun webapp FineReader en de OCR-technologie kunt gebruiken om PDF's, scans en andere afbeeldingsbestanden om te zetten in bewerkbare tekst.
Hoewel de online versie lang niet zo krachtig is als de desktopversie, is ABBYY FineReader Online misschien wel de krachtigste online OCR-service die nu beschikbaar is.
ABBYY FineReader neemt het meeste werk over dat zou moeten worden uitgevoerd om OCR succesvol te laten zijn in een andere service, omdat de voorverwerking in de app zelf wordt uitgevoerd. ABBYY FineReader corrigeert beeldvervormingen, zoals de richting van de pagina en ruis, voordat de scan wordt gestart. Uiteraard zijn aspecten zoals helderheid en beeldkwaliteit afhankelijk van de gebruiker, maar aan het eind van de gebruiker is verder bewerken niet nodig.
Na de voorbewerking, splitst ABBYY FineReader het document op in elementen zoals tabellen, afbeeldingen en tekstblokken voordat lijnen en afzonderlijke letters en woorden worden gedetecteerd. De technologie bepaalt vervolgens de relatie van alle eigenschappen van de pagina met elkaar. Dit is om te zorgen voor een nauwkeurige replicatie van niet alleen de tekst in het document, maar ook de volledige lay-out van de pagina zelf.
ABBYY FineReader Online ondersteunt momenteel 42 talen, zelfs talen met niet-Latijnse tekens, zoals het Hebreeuws en Koreaans. Er is woordenboekondersteuning voor 37 van die talen, wat helpt een nog nauwkeurigere recreatie te creëren door gedetecteerde woorden in ten minste één woordenboek te controleren. De service is in staat tot OCR op documenten met maximaal drie verschillende talen op een bepaald moment.
De volledige lijst met ondersteunde talen voor ABBYY FineReader Online.Naast taalondersteuning kan de service oude teksten in het Duits en het Lets scannen die in zwarte letters zijn ingesteld, waardoor ABBYY FineReader Online een haalbare optie is voor de OCR van historische documenten.
Een dergelijke krachtige dienst komt niet zonder een prijs. OCR op ABBYY FineReader Online is niet al te prijzig: paginakredieten kosten respectievelijk $ 3- $ 10USD voor stappen van 20-200 paginanummers. U krijgt echter gratis 20 paginacredits wanneer u zich aanmeldt voor de service.
Nadat u bent aangemeld bij uw ABBYY FineReader Online-account, wordt u doorgestuurd naar de uploadpagina.
Zoek eerst het document of de afbeelding die u wilt uploaden en zorg ervoor dat ABBYY FineReader OCR ondersteunt voor uw bestand. De service ondersteunt OCR voor PDF-, JPG-, PNG-, BMP-, PCC-, DACX-, TIF-, GIF- en Dvdvu-bestanden. Maximale bestandsgrootte is 30 MB.
Tip: Voor de beste resultaten moet u ervoor zorgen dat uw bestand van hoge kwaliteit is en dat de tekst ten minste 9pt of 10pt is.
Als u een fysiek document wilt OCR, gebruik dan een hardwarescanner, zoals Doxie, of een mobiele app om het fysieke document om te zetten in een ABBYY FineReader-compatibel bestandsformaat.
Als uw document klaar is om te uploaden, klikt u op Uploaden knop onder de Laad een bestand om te verwerken veld. Zoek uw bestand in de Finder venster, en klik Open. Ik zou aanraden om de Stuur me een downloadlink per e-mail vak net onder het bestandsveld voor eenvoudige toegang tot het opnieuw gemaakte document nadat het is OCRed. Het geüploade bestand wordt weergegeven in de Selecteer bestanden om te verwerken veld een paar secties hieronder.
Selecteer een bestand om te uploaden.Definieer vervolgens de talen van uw document onder de Selecteer de taal (talen) van uw document veld. Blader door de lijst totdat u de talen van uw document hebt gevonden. Als u meer dan één taal hebt, selecteert u de extra talen door de knop ingedrukt te houden Commando toets, als u een Mac gebruikt, of de Controle toets, als u een pc gebruikt en klikt.
ABBYY FineReader Online ondersteunt OCR voor maximaal drie talen in één document.Als u een ouder document scant dat was ingesteld als zwarte letter, klikt u op hyperlink rechts van het taalkeuzevak. De taallijst zal veranderen en u de juiste Duitse en Letse opties voor OCR bieden.
Ga dan naar de Selecteer een uitvoerformaat veld om het formaat te selecteren waarnaar het bestand wordt OCRed. Op dit moment kan ABBYY FineReader Online de bestanden exporteren als Microsoft Word of Excel (in de indelingen 97-2003 en Nieuwe versie), Open Office, PDF, RTF of platte tekst. Kies het formaat waarin u wilt dat het laatste document wordt geconverteerd in het vervolgkeuzemenu.
Selecteer een uitvoerformaat in het vervolgkeuzemenu.Tip: Wanneer u uw documentuitvoer selecteert, moet u op uw hoede zijn voor tabellen, grafieken en andere afbeeldingen die mogelijk in uw invoerdocument staan, omdat de tekstverwerker deze mogelijk niet goed verwerkt en slechte resultaten oplevert.
Zorg ervoor dat de documenten die u wilt OCRed zijn afgevinkt in de Selecteer bestanden om te verwerken veld. Druk nu op Herken knop en ABBYY FineReader begint OCR.
druk op Herken om het OCR-proces te starten.Na het indrukken van Herken, je wordt doorgestuurd naar de Taakgeschiedenis pagina, waar u de voortgang van het OCRed-document kunt controleren. Afhankelijk van de bestandsgrootte kan OCR variëren van enkele seconden tot enkele minuten.
Zodra de verwerking is beëindigd, kunt u uw document downloaden in de indeling die u hebt geselecteerd en kunt u het document rechtstreeks vanuit de web-app exporteren naar Google Drive, Evernote en Dropbox. U kunt ook de kwaliteit van de OCR-taak beoordelen, waardoor ABBYY zijn producten kan verbeteren.
Zodra de verwerking is voltooid, kunt u het document downloaden of het rechtstreeks exporteren naar een cloudservice.OCR-documenten blijven twee weken op de ABBYY FineReader-server staan voordat ze automatisch worden verwijderd.
ABBYY FineReader Online is een gemakkelijke manier om ingewikkelde documenten op het web te OCR voor een lage prijs. Hoewel het niet helemaal perfect is in het omgaan met afbeeldingen en andere stilistische elementen, vertaalt het de tekst vlekkeloos, zelfs in documenten met meer dan één taal, in veel verschillende bewerkbare bestandsindelingen..
Als u problemen hebt met OCR in ABBYY FineReader Online of als u zich ergens zorgen over maakt of als u papierloos gaat werken, laat dan hieronder een reactie achter!