5 manieren om documenten te OCR op uw Mac

Als je bent aangespoord om te proberen naar een papierloos kantoor te verhuizen, ben je niet de enige! 2013 is het jaar waarin het papierloos wordt en dat betekent niet alleen dat oude bonnetjes en correspondentie worden gescand en ook volledig worden gedigitaliseerd. In deze gids laten we u vijf verschillende apps zien waarmee u documenten die u hebt gescand, kunt converteren naar volledig doorzoekbare documenten met behulp van de technologie OCR.

Update: U kunt ook eenvoudig documenten met OCR-technologie scannen via uw iPhone, door het nieuwe te gebruiken DocScan-app op Envato Market.

DocScan-app op Envato Market

Als u liever een traditionele scanner gebruikt om uw documenten te scannen, lees dan verder voor meer informatie over hoe u dat doet.

Wat is OCR?

OCR staat voor Optische karakter erkenning. Wanneer u een document scant, kan de scanner zelf niet weten wat het verschil is tussen tekst en afbeelding, dus alles wat u scant, is in feite een afbeelding. Dit geldt ook als u ervoor kiest om het op te slaan als een PDF, omdat u (nog) geen tekst kunt selecteren.

OCR-technologie bestaat al een tijdje, maar het is een vaak ingetogen functie die meestal nooit over het hoofd wordt gezien. Als je de afgelopen jaren een scanner hebt gekocht, is de kans groot dat je al behoorlijk handige OCR-software hebt op de schijf waarmee deze is meegeleverd! Als Mac-gebruikers worden we soms verwend door het feit dat we ons bijna nooit zorgen hoeven te maken over het installeren van stuurprogramma's, dus software op dezelfde schijven wordt vaak genegeerd.

Tip: Een PDF is slechts een container voor tekst en afbeeldingen, zodat alle ontvangsten of correspondentie die u hebt gescand en opgeslagen als PDF nog niet doorzoekbaar zijn.


1. Prizmo

Prizmo is een speciale OCR-app. Het is niet bedoeld om u te helpen bij het bijsnijden of rechtzetten van uw gescande documenten, het enige doel is om de tekst van eventuele scans te analyseren en om te zetten in doorzoekbare tekst. Het is niet alleen beperkt tot gewone tekstdocumenten zoals bonnen en correspondentie, Prizmo zal zelfs oude kranten en tijdschriften analyseren, boekomslagen, vrijwel alles met elke vorm, grootte en kleur van tekst is iets dat Prizmo zal omzetten.

Prizmo biedt de mogelijkheid om scans rechtstreeks van te maken Beeldopname, De ingebouwde camera- en scannerimport-app van OS X, zodat u deze kunt gebruiken in combinatie met een bestaande scanner. U kunt ook bestaande bestanden importeren als u ze al hebt gescand.

Stap 1

Wanneer u Prizmo start, wordt u gevraagd om een ​​nieuw document te maken of een bestaand document te openen. Alvorens verder te gaan, verwijst dit naar een Prizmo document en niet degene die u wilt analyseren. Het kan een beetje verwarrend zijn, maar Prizmo kan de scans opslaan die u hebt gedaan als u ooit terug moet gaan om de tekst te wijzigen, bijvoorbeeld als u gescand hebt in een 200 pagina's tellende PDF en gemerkt dat sommige pagina's niet goed werden geanalyseerd in het midden en wat tekst ontbrak. Door uw werk in Prizmo op te slaan, kunt u teruggaan en eventuele wijzigingen aanbrengen.


Prizmo maakt zijn eigen documenten zodat u later naar hen kunt verwijzen (en ze kunt bewerken)

kiezen Nieuw document… en u krijgt een nieuw Prizmo-document te zien dat u gaat gebruiken.


Prizmo maakt zijn eigen documenten zodat u later naar hen kunt verwijzen (en ze kunt bewerken)

We kunnen een afbeeldingsbestand slepen (JPG, PDF, TIFF, enz.), Importeren van onze scanner of zelfs bladeren door een fotobibliotheek.

Stap 2

Voor deze tutorial gebruik ik een bestaand document dat ik heb gescand in mijn flatbedscanner. Het werd direct als PDF opgeslagen en zoals je kunt zien, kan ik geen enkele tekst markeren.

kiezen Open afbeeldingbestand ... en selecteer een afbeelding om te gebruiken.

Stap 3

Zodra u de afbeelding hebt geladen, krijgt u een vertrouwde pagina-indeling te zien, compleet met paginaminiaturen aan de linkerkant.


Prizmo heeft een uiterlijk dat erg lijkt op Apples Preview-app

We hebben onderaan enkele aanpassingsknoppen waarmee we de rotatie kunnen aanpassen, de afbeelding bijsnijden en meer. Prizmo zal automatisch de vereisten van het document detecteren en de noodzakelijke instellingen automatisch wijzigen, maar we kunnen ze altijd aanpassen waar nodig.

Stap 4

Ik ben blij met de standaardinstellingen, dus klik gewoon op Herken en Prizmo detecteert automatisch tekstgebieden en analyseert ze vrijwel onmiddellijk.


Prizmo kan OCR-documenten snel en nauwkeurig archiveren

Op dezelfde manier als u een te scannen gebied tekent tijdens het scannen van een document, kan hetzelfde worden gedaan voor tekstgebieden. Prizmo zal dit automatisch proberen, maar nogmaals, u hebt volledige controle.

De geanalyseerde tekst wordt vervolgens weergegeven aan de rechterkant van het document. In dit stadium wordt niets opgeslagen. Als de OCR niet volledig correct was, kunt u naar binnen gaan en eventuele wijzigingen aanbrengen.

Stap 5

Prizmo was 100% accuraat met mijn document, dus er zijn geen veranderingen die ik moet aanbrengen. U kunt uw document exporteren naar een aantal cloudservices zoals Dropbox en Google Drive, of voeg ze toe aan een nieuw e-mailbericht.


Prizmo biedt ondersteuning voor een aantal cloudservices

Ik ga mijn document op mijn bureaublad opslaan, dus ik zal selecteren Het dossier…

Prizmo is uitermate handig voor iedereen die op regelmatige basis documenten scant met elk type scanner. Met de geavanceerde bedieningselementen waartoe u toegang hebt, kunt u instellen hoe het OCR-proces werkt, in plaats van te vertrouwen op volledig automatische instellingen.

Meer informatie over Prizmo.


2. ABBYY FineReader Express

ABBYY FineReader Express is een andere gespecialiseerde OCR-tool die speciaal voor de taak is ontworpen en die het zeer goed doet. Het OCR-proces is geautomatiseerd, dus de enige gebruikersinteractie vertelt ABBYY FineReader Express welk document moet worden geladen en waar de OCR-versie moet worden opgeslagen.

In plaats van een nieuw document te maken of een bestaand document te openen, heeft ABBYY FineReader Express een Snelle taken paneel dat bij de lancering opent. Het is een snelle manier om OCR-documenten te maken met zo min mogelijk muisklikken.

U kunt gescande documenten converteren naar een aantal verschillende indelingen en een voordeel is de mogelijkheid om een ​​spreadsheet te OCRen en een volledig doorzoekbare - en bewerkbare - af te drukken, waardoor het erg verleidelijk is voor zakelijke gebruikers.

Stap 1

Omdat we al een PDF hebben, moeten we OCR gebruiken, ABBYY FineReader Express starten en selecteren Converteren naar doorzoekbare PDF en kies het document dat je wilt OCR.


ABBYY FineReader Express bevat een paneel Snelle taken om OCR gemakkelijk te maken

Stap 2

Dat is het eigenlijk! ABBYY FineReader Express vraagt ​​u om het nieuwe OCR-document op te slaan op een locatie naar keuze. Vreemd genoeg wordt u gevraagd het document op te slaan voordat het voorbeeld wordt geladen, zodat u kunt zien of ABBYY FineReader Express het document correct heeft OCR. U moet annuleren het document opslaan en het in plaats daarvan opslaan in het menu.


ABBYY is een van de eenvoudigste apps om te gebruiken als het gaat om OCR

Meer informatie over ABBYY FineReader Express.


3. Doxie

We hebben de Doxie-scanner en -software besproken in onze vorige gids "Go Paperless met Doxie"Maar het is de moeite waard om de ingebouwde OCR-functies opnieuw te vermelden.

Doxie bevat ingebouwde OCR in de import-app zodat alle documenten die u scant de mogelijkheid hebben om te worden geanalyseerd. Doxie bevat echter niet veel besturingselementen en automatiseert het grootste deel van het proces.


Doxie heeft minder besturingselementen dan een app zoals Prizmo

Stap 1

Scan elk document dat u wilt OCR en start vervolgens de Doxie app, zorg ervoor dat uw Doxie-scanner is aangesloten.

Stap 2

Nadat u uw gescande document hebt geïmporteerd, kunt u selecteren waar en hoe u het wilt exporteren. In dit geval zal ik selecteren PDF met OCR (zwart en wit). Het is beter om het type document te selecteren, omdat het een formaat kan gebruiken dat minder ruimte in beslag neemt.


Doxie bevat de optie om te exporteren als een PDF of met OCR toegevoegd

Tip: Je merkt vaak dat veel bedrijven correspondentiebrieven sturen die een bepaalde kleur hebben om bij hun branding te blijven - ik zou ze alleen maar als zwart-wit willen opslaan om de bestandsgrootte zo laag mogelijk te houden.

Stap 3

Zodra u selecteert waar u de PDF wilt opslaan, zal Doxie het document OCR en exporteren. De tekst is volledig doorzoekbaar en vervangt niet de tekst van de scan, maar gebruikt een slimme functie van de aangeroepen PDF's tekst overlay. Uw document kan er hetzelfde uitzien als voorheen, maar dat is goed. In plaats daarvan wordt de tekst transparant over de tekst geplaatst, waardoor deze doorzoekbaar en markeerbaar is.


Doxie behoudt nog steeds het uiterlijk van de PDF, maar overlays met tekst die kan worden gemarkeerd

Hoewel het Doxie-proces heel eenvoudig is, zijn er niet zoveel opties als een speciale OCR-app zoals Prizmo. Maar het betekent wel dat als u al een Doxie-gebruiker bent of slechts een lichte scan uitvoert, deze functies u niet echt van pas zullen komen.

Doxie-scanners starten vanaf $ 119 en zijn verkrijgbaar bij Getdoxie.com.


4. PDFPen

PDFPen is een beetje anders dan Prizmo, want het is niet alleen een OCR-tool. Het is een alles-in-een tool ontworpen om PDF's in te vullen, te bewerken en te wijzigen. Een van de functies is dat het gescande documenten kan detecteren en OCR in één stap kan uitvoeren.

Stap 1

Start PDFPen en het zal u automatisch vragen om een ​​PDF te selecteren om te openen. Selecteer een gescand document en klik op Open.

Stap 2

Zodra PDFPen het document opent en detecteert dat het is gescand (in plaats van gedownload of door de computer is gegenereerd), zal het u vragen of u het wilt analyseren en de tekst wilt digitaliseren. U hebt de mogelijkheid om alleen de OCR-tool op de huidige pagina of het hele document uit te voeren.


PDFPen is een andere app die is ontworpen om het grootste deel van het OCR-proces te automatiseren

Geef de gewenste taal op en selecteer de relevante knop - in dit geval heb ik zojuist geselecteerd OCR-document.

Stap 3

Sla het PDF-bestand op nadat het is voltooid. In tegenstelling tot Doxie of Prizmo, maakt u niet meteen een nieuwe kopie. PDFPen wijzigt bestaande PDF-bestanden, zodat u eenvoudig de wijzigingen kunt opslaan en het ongemak van het beheren van een extra bestand elimineert.

Meer informatie over PDFPen.


5. Evernote

Evernote is een uiterst populaire note-syncing-service die meer als een hybride tussen een plakboek en een notebook fungeert. Zie het als een archiefkast vol met stukjes informatie die altijd beschikbaar is en altijd gemakkelijk te doorzoeken is.

We hebben Evernote hier uitgebreid besproken op Mactuts + en ik moedig iedereen die Evernote gebruikt (of wil het meer gebruiken) aan om ons artikel te lezen. "Taming the Elephant: Awesome Evernote Tips and Tricks"Om er meer over te leren.

Een kenmerk van Evernote dat vaak over het hoofd wordt gezien en nooit echt aan de gebruiker wordt getoond, is de automatische OCR-service. Jawel, elke afbeelding die u toevoegt aan Evernote wordt gescand voor tekst en toegevoegd aan uw notitie. Het is uitgevoerd aan serverzijde, dus het toevoegen van een document aan Evernote wordt niet meteen geconverteerd. Vanwege het aantal Evernote-gebruikers is het ook niet onmiddellijk. Om serverproblemen te voorkomen, zijn alle documenten die OCR vereisen in de wachtrij geplaatst. Er is geen manier om te weten wanneer het wordt gescand, maar het is meestal binnen 24-48 uur. Als je een premium lid bent, is het sneller.

Stap 1

Om een ​​document te scannen, sleept u het en voegt u het toe aan een nieuwe of bestaande notitie, en zorg ervoor dat u Evernote synchroniseert zodra u het hebt gedaan. Dat is alles wat er is.


Evernote ondersteunt bijlagen voor notities en eventuele afbeeldingen worden automatisch door hun servers OCR'd

Stap 2

Uiteindelijk zal Evernote het document scannen en OCR uitvoeren. Als dat gebeurt, wordt het document vervolgens bijgewerkt en gesynchroniseerd terug naar Evernote op uw apparaat. Het kostte Evernote ongeveer tien minuten om OCR het document dat ik heb toegevoegd te OCR (ik ben een abonnee van Evernote Premium dus de tijden zullen variëren).

De OCR is meestal erg nauwkeurig, maar er is geen controle over hoe de OCR werkt. Het gebeurt automatisch zonder gebruikersinvoer of -instellingen.

Stap 3

U kunt dan naar tekst zoeken en, zoals u kunt zien, wordt de tekst gemarkeerd tijdens het zoeken. Nadat u de notitie hebt bekeken, lijkt deze 100% nauwkeurig te zijn geweest.


Zodra het document door de servers van Evernote is herkend, kan het doorzocht worden in Evernote en hebt u de mogelijkheid om het document ook als een doorzoekbare PDF te exporteren

Stap 4 (optioneel)

Als u een doorzoekbare PDF-versie buiten Evernote wilt houden, kunt u met de rechtermuisknop klikken en selecteren Bewaar doorzoekbare PDF als ...

Het is niet ideaal, omdat Evernote elk woord met een groene doos omwikkelt, dus afdrukken is misschien niet zo'n goed idee, maar het werkt.

Hoewel de functies vrij eenvoudig zijn, wordt het gebruik van Evernote als centrale hub voor uw papierloze kantoor nog populairder, dus als u hetzelfde wilt doen, kunt u elk OCR-proces verwijderen en scans rechtstreeks in Evernote laten vallen. Het zorgt voor de OCR voor u en aangezien de meeste items bonnetjes en correspondentie zullen zijn, hebt u waarschijnlijk bijna geen probleem met de OCR-service van Evernote.

Evernote is gratis, met premium-accounts voor $ 5 per maand of $ 35 per jaar.


Afsluiten

Er zijn een aantal manieren waarop u die gescande documenten kunt digitaliseren zodat ze door tekst kunnen worden doorzocht en de kosten voor het gebruik van een OCR-tool drastisch zijn gedaald. Voorbij zijn de dagen dat je vastzit aan de app waarmee je scanner is meegeleverd, je bent nu vrij om vrijwel elke OCR-app te gebruiken die je wilt.

Als u merkt dat u niet alleen OCR-tools gebruikt, maar een manier wilt om PDF's te manipuleren, dan is PDFPen de beste keuze. Voor iedereen die gewoon een manier wil om OCR te gebruiken, zou ik Prizmo aanraden. Zelfs als je een Doxie hebt, geeft Prizmo je meer controle over hoe het OCR-proces werkt.

Voor iedereen die heel af en toe iets wil OCR is het krijgen van een gratis Evernote-account de meest economische optie.

Heb je geprobeerd papierloos te gaan? Doet u moeite met OCR of is alles doorzoekbaar in uw digitale kantoor? We horen graag van je, dus, zoals altijd, bespreek het onderwerp verder in de comments.