Google Drive kann OCR: Text aus einem Bild auslesen

OCR, Optical Character Research, bietet die Möglichkeit, Buchstaben und Texte aus Bildern zu lesen. Die Technologie arbeitet selbstständig, wodurch User die Möglichkeit erhalten, den enthaltenen Text schnell zu extrahieren. Viele Programme bieten diese Funktion, wozu auch Google Drive bzw. GOgole Docs zählt. Der User muss dank der Funktion in Bildern enthaltende Texte nicht mehr selbstständig lesen und erarbeiten, da das Programm dies eigenständig tut, insofern die Texte erkannt werden können.

Texte aus Bilder erhalten

Viele Bilder enthalten nicht nur Grafiken, sondern ebenfalls Texte. Im Normalfall müssen diese Bilder gelesen und händisch niedergeschrieben werden, um sie vom eigentlich Bild zu trennen. Google-Drive-User allerdings erhalten dank der integrierten OCR-Funktion die Möglichkeit, Texte aus gespeicherten Bildern zu extrahieren. Die Funktion der optischen Zeichenerkennung wurde in Google Docs eingebaut und steht somit jedem User frei.

Um die OCR-Funktion zu nutzen, muss der User sich zunächst mit dem Webbrowser in sein Google Drive Konto einloggen. Welcher Browser hierfür verwendet wird, ist egal, da Google Docs nicht zwischen verschiedenen Browsern unterscheidet. Nun wird im Google Drive Konto ein Ordner erstellt, welcher zugleich geöffnet wird. In diesem Ordner werden sämtliche Bilder, welche Texte enthalten, gespeichert. Der Upload der infrage kommenden Bilder geschieht leicht mittels Drag & Drop. Die Bilder können einzeln oder gleichzeitig upgeloaded werden.

Umwandlung in Google Docs durchführen

Nun muss der User mit einem Rechtsklick das erste Bild auswählen, welches er bearbeitet haben möchte. Die OCR-Funktion steht zwar jedem Bild mit Textinhalt offen, kann aber immer nur ein einziges Bild gleichzeitig bearbeiten. Via „Öffnen mit“ wählt der User jetzt Google Docs aus, sodass Google Drive automatisch das Bild in einem Google Docs Dokument öffnet. Das Dokument besitzt denselben Namen wie das ausgewählte Bild. Während im oberen Bereich das Ursprungsbild abgebildet wird, muss der User etwas runter scrollen, um den ausgewählten Text zu erhalten. Der ausgegebene Text kann jederzeit nach Belieben kopiert und selbstständig bearbeitet werden, wodurch er unter anderem in andere Dokumente eingefügt werden kann.

Um die OCR-Funktion zu nutzen, muss der User keine zusätzliche Software für Texterkennung installieren. Google Docs OCR-Funktion arbeitet automatisch im Webbrowser und bietet die Möglichkeit, Bilder, Fotos und PDF-Dateien zu bearbeiten. Voraussetzung für eine erfolgreiche Bearbeitung der Bilder und somit den Erhalt der Textinformationen sind Texte, welche die Funktion erkennen kann. Dies sind vor allem Texte in normaler Schrift. Verschnörkelte Schönschriften oder alte Schriften kann die Funktion nicht immer bzw. nur selten erkennen.

Verschiedene Formate sorgen für unterschiedliche Ergebnisse

Neben der Tatsache, dass das Programm nicht jede Textart aufgrund der verwendeten Schrift erkennt, fallen die Ergebnisse ebenfalls unterschiedlich aus. Für ein bestmögliches Ergebnis sollte der User vor der Bearbeitung die Bilddateien in ein PDF-Dokument umwandeln. Dieses erkennt Google Docs am besten an, wodurch die Textinhalte wesentlich besser wiedergegeben werden als normale Bildformate wie JPG oder PNG. Ausserdem besitzt der generelle Aufbau der Texte eine Auswirkung auf die Bearbeitung. Die Mindesthöhe der Textzeilen sollte 10 Pixel sein. Auch müssen die Fotos scharf und möglichst hochauflösend sein. Unscharfe Bilder mit Texten erkennt das Programm nicht. Je besser der Kontrast im Verhältnis zum Hintergrund ausfällt, desto besser fällt das Erkennungsergebnis aus.

Damit der Text ordnungsgemäss erkennt wird, muss das Dokument zudem korrekt ausgerichtet sein. Spiegelverkehrte Bilder oder jene in Querformat müssen vor der Bearbeitung passend ausgerichtet werden. Hingegen stellt die Sprache des Dokuments für Google Docs kein Hindernis dar, da das Programm die Sprache automatisch erkennt. Die besten Ergebnisse in jener Sprache erzielen Standardschriften wie etwa Times New Roman oder Arial. Handschriften hingegen lassen sich im Grossteil der Fälle nicht umwandeln. Schriftarten, welche eine Schreibschrift imitieren, können aber erkannt werden. Dennoch treten hier häufig Fehler auf, sodass Dokumente mit Schnörkelschriften immer Korrekturgelesen werden müssen.