Lesen, was drinsteht — rausholen, was drinsteckt: Wie blinde Computernutzer sich PDF-Dokumente zugänglich machen geschrieben von Oliver Nadig (2005)
Dieser Beitrag wurde von Oliver Nadig in Oktober 2005 verfasst. Die vorliegende Fassung ist die Version 1.02 vom 25.1.2006.
5.3 Von PDF nach Text mit GSView
"Die Programme Ghostscript und GSView kommen immer dann zum Einsatz, wenn eine PDF-Datei dem Screenreader den Zugriff auf ihren Inhalt verweigert. Dabei stellt GSView die Bedienoberfläche für das Programm Ghostscript dar, mit dem Sie gar nicht in Berührung kommen (die Bedienung von Ghostscript selbst wäre übrigens noch weit unbequemer als diejenige von PDFToText).
In Abschnitt 2.3 habe ich erläutert, wie Ghostscript und GSView installiert werden, wie GSView auf deutsch umgestellt wird und wie man GSView in das Kontextmenü von PDF-Dateien einbaut. Ich gehe im folgenden davon aus, dass Sie diese Schritte nachvollzogen haben – dann ist das Umwandeln einer PDF-Datei in Text mittels GSView nur noch ein Kinderspiel:
- Wählen Sie im "Arbeitsplatz" oder im Windows die um zu wandelnde PDF-Datei mit den Pfeiltasten an.
- Öffnen Sie das Kontextmenü mit der KONTEXTTASTE oder der Tastenkombination UMSCHALT+F10.
- Rufen Sie darin den Menüpunkt 'Öffnen mit' auf.
- Wählen Sie im eingeblendeten Untermenü den Eintrag 'gsview32' und bestätigen Sie mit der "Eingabetaste".
- GSView öffnet sich und zeigt zunächst den Registrierungsdialog an. Bestätigen Sie diesen mit der "Eingabetaste". Warten Sie einige Sekunden, bis GSView das PDF-Dokument geladen hat.
- Rufen Sie den Menüpunkt 'Bearbeiten > Text extrahieren' (ALT+B, T) auf. Sollte sich daraufhin das Dialogfenster 'Auswahl Seiten' nicht öffnen, warten Sie noch ein paar Sekunden, bevor Sie erneut 'Bearbeiten > Text extrahieren' aufrufen.
- Im eingeblendeten Dialog 'Seiten auswählen' betätigen Sie zunächst mit der Tastenkombination ALT+S die Schaltfläche 'Alle Seiten' und drücken anschließend die "Eingabetaste", um das Fenster mit 'OK' zu bestätigen.
- Bei großen Dokumenten kann die Textextraktion mehrere Minuten in Anspruch nehmen. Sie können den Fortschritt überwachen, indem Sie sich von Ihrem Screenreader in gewissen Zeitabständen die Statusleiste des GSView-Fensters vorlesen lassen; dort erhöht sich nach und nach die angezeigte Prozentzahl.
- Konnte die Textextraktion erfolgreich durchgeführt werden, erscheint das Fenster 'Datei speichern unter'. Legen Sie darin für die zu speichernde Textdatei einen Namen (einschließlich der Endung .txt) und einen Speicherort fest; bestätigen Sie das Fenster durch Betätigen der Schaltfläche 'Speichern'. Bricht GSView die Textextraktion mit einer Fehlermeldung ab, ist die PDF-Datei höchst wahrscheinlich beschädigt. Sie brauchen dann keine großen Hoffnungen mehr zu haben, sie mit einem anderen Programm öffnen und Ihren Inhalt lesen zu können. Wenden Sie sich gegebenenfalls an den Autor, um ein unbeschädigtes Exemplar der Datei zu erhalten.
- Schließen Sie GSView mit ALT+F4.
Achtung: Überprüfen Sie die entstandene Textdatei unbedingt auf ihre Lesbarkeit. Unter Umständen werden für Anführungszeichen und Trennstriche nicht die korrekten Zeichen dargestellt. Tauschen Sie dann mit Hilfe der Funktion 'Suchen und Ersetzen' eines Textverarbeitungsprogramms die falschen Zeichen durch die Richtigen aus."
Der Beitrag Lesen, was drinsteht — rausholen, was drinsteckt: Wie blinde Computernutzer sich PDF-Dokumente zugänglich machen besteht aus folgenden einzelnen Webseiten: Besonders die schlechte Aufbereitung von PDF-Dokumenten verstellt blinden Nutzern oft die selbständige Verwendung der Dokumente. Neben dem Adobe Reader bietet weitere Software die Möglichkeit für Screenreadernutzer, auf den Inhalt von PDF-Dokumenten zuzugreifen. Was blinde und sehbehinderte Nutzer bei der Installation des Adobe Readers beachten müssen. Beschreibung des Installationsvorgangs und der zu beachtenden Einstellungen, damit das Lesen von PDF-Dokumenten optimal gelingt. Installation von XPDF bzw. PDFToText mit Hinweisen für blinde und sehbehinderte Nutzer. GSView und Ghostscript sind für Screenreadernutzer zusätzlich erforderlich zum Adobe Reader, wenn sie PDF-Dokumente mit Sicherheitseinstellungen lesen wollen. Hier finden Sie eine Anleitung zur Installation dieser Software mit Hinweisen zur Bedienung in einem Screenreader. Zum Lesen von PDF-Dokumenten in einer Sprachausgabe ist die Installation einer OCR-Software für viele Fälle sinnvoll. Installation und Hinweise zu Einstellungen werden hier beschrieben für Omnipage Pro 14. Ein Entscheidungsschema für blinde Nutzer, wann sie welches Programm zum Lesen von PDF-Dokumenten einsetzen sollen. Diese umfassen vor allem den Adobe Reader, OCR-Programmen PDFToText (XPDF) und GSView (Ghostscript). Einführung in die Nutzung des Adobe Readers zum Lesen von PDF in Screenreadern. Wie ein Screenreader mit dem Adobe Reader über MSAA und andere Methoden arbeitet. Die Bedienung des Adobe Readers mit der Tastatur ist für Screenreadernutzer wichtig. Das Einscannen von Formularen und die Bereitstellung als PDF reicht nicht aus, um die Zugänglichkeit der Formulare herzustellen. Screenreader benötigen die Auszeichnung mit Tags sowie weitere MSAA-Informationen. Die Verwendung der Adobe Reader-Sprachausgabe zum Vorlesen von PDF-Dokumenten und -Formularen erfordert eine SAPI-kompatible Sprachausgabe. Einige Einstellungen sollten im Adobe Reader vorgenommen werden, wenn Screenreader auf PDF-Dokumente besser zugreifen können sollen. Es gibt verschiedene Möglichkeiten, aus PDF Textdateien zu erstellen. Extrahieren von Text aus einer PDF unter Verwendung eines Screenreaders. Umwandlung von PDF nach Text mit PDFToText: Was Screenreadernutzer beachten müssen. (Aktuelle Seite) Die Verwendung von PDF in Screenreadern ist oft problematisch. Diese Seite beschreibt, wie blinde Nutzer PDF-Dokumente mit einer OCR-Software (Omnipage Pro 12 und 14, An Open Book 6 und 7) in ein zugängliches Format wie Microsoft Word umwandeln können. Umwandlung einer PDF in eine Screenreader-fähigen Datei über einen kostenlosen Web-Service. Hintergrundwissen zu Tagged PDF oder Verschlüsselungsmöglichkeiten kann Screenreadernutzern bei der Interpretation von Fehlermeldungen hilfreich sein. Probleme im Screenreader bereiten können Konflikte im Zusammenspiel verschiedener Versionen von z.B. PDF-, Adobe Reader und der Verschlüsselungstechnik. Bei der Verschlüsselung von PDF-Dokumenten ist die richtige Vorgehensweise besonders wichtig, um die Zugänglichkeit für Screenreadernutzer zu gewährleisten. Tags sind beim Lesen und beim Export in andere Formate notwendig, damit Screenreadernutzer die Struktur der Inhalte nachvollziehen können. "Viele Wege führen nach Rom" — aber nur die richtige Technik im PDF-Erstellungsprozess führt zu zugänglichen Dokumenten. Blinde Nutzer sind bei der Verwendung von PDF-Dokumenten immer noch stark benachteiligt. Hersteller und Autoren könnten diese Situation verbessern. Einige Artikel/Bücher und Online-Ressourcen zur Barrierefreiheit von PDF. Einige Angaben zu Oliver Nadig. Die folgenden Begriffe dieser Seite werden auch im Glossar definiert:
Blättern zur nächsten oder vorherigen Seite