Wer sich annähernd mit seiner persönlichen Umsetzung des papierlosen Büros auseinander gesetzt hat, der wird viele Wege und Lösungen gefunden haben, wie man digitale Unterlagen erstellt und sortiert ablegt. Was aber bei allen Möglichkeiten identisch ist, ist das Dateiformat, denn ohne PDFs geht nicht viel. Möchte man aber nun nicht auf tiefe Ordnerstrukturen oder unzählig viele Tags zurückgreifen, müssen diese aber vor der Ablage eine Texterkennung (englisch: OCR für Automatic text recognition) durchlaufen haben, anderenfalls lassen sich auch PDF-Dokumente nicht nach Inhalten durchsuchen. Gerade die Durchsuchbarkeit ist für mich DIE Voraussetzung, zumal ich nur eine Hand voll Ordner und sonst kein weiteres Tool nutze – kurz einen Suchbegriff in Finder eingeben, fertig.
Wie man PDF-Dateien nun durchsuchbar macht, ist je nach Workflow unterschiedlich: Teilweise direkt nach dem Scannen (ich nutze Scanbot), teilweise mit gesonderten Tools die zumeist kostenpflichtig sind. Entwickler Dirk Holtwick hat nun ebenfalls ein Mac-Tool für diese Zwecke veröffentlicht, welches auf den Namen PDFify hört und kostenlos nutzbar ist. Mit PDFify lassen sich aus „flattened“ PDFs, Bildern, E-Mails und Webseiten durchsuchbare PDF-Dokumente erstellen – darüber hinaus kann auf angeschlossene Scanner und Kameras zugegriffen werden. Die Umwandlung und Texterkennung funktioniert mit nur einem Klick und ohne die Dokumente zuvor auf einen Server hochzuladen – die Erkennung von Worten und Ziffern geschieht direkt auf dem Mac. Ich habe mal ein paar Dokumente und Bilder durchgejagt und bin überrascht, wie gut die Texterkennung funktioniert.
Warum kostenlos? Kurz und knapp: Werbung und Spielwiese. Denn Holtwick entwickelt auch Receipts, eine kostenpflichtigen Mac-App zur Belegverwaltung für Freelancer und Selbständige. Auch Receipts besitzt eine Texterkennung und anhand der freiwillig bereitgestellten anonymen Analysedaten konnte Holtwick erkennen, dass eingescannte Belege einen erheblichen Teil der verarbeiteten Dokumente ausmachen und Nutzer gerne auf die Texterkennung zurückgreifen. Außerdem zeigte sich, dass die Erkennungsrate noch Optimierungspotential besitzt. Mit diesen Erkenntnissen überarbeitete Holtwick die Bereiche Scanner und Texterkennung, woraus dann PDFify entstanden ist, um diese Features und andere Neuerungen besser prüfen zu können. Win-Win-Situation für Nutzer und Entwickler.
Quelle Dirk Holtwick via PH
Schreibe den ersten Kommentar