Lesen, was drinsteht — rausholen, was drinsteckt: Wie blinde Computernutzer sich PDF-Dokumente zugänglich machen geschrieben von Oliver Nadig (2005)
Dieser Beitrag wurde von Oliver Nadig in Oktober 2005 verfasst. Die vorliegende Fassung ist die Version 1.02 vom 25.1.2006.
Dateien im sogenannten Portable Document Format (PDF) finden immer größere Verbreitung – vor allem im Internet. Dafür gibt es zwei Hauptgründe:
- PDF-Dateien sind so beschaffen, dass sie – im Gegensatz zu den meisten anderen Dokumentformaten – auf allen Betriebssystemen und in allen Anzeigeprogrammen stets gleich aussehen, und zwar immer so, wie es der Autor beabsichtigt.
- Autoren einer PDF-Datei können ihr geistiges Eigentum wirksam schützen, indem sie das Ausdrucken und Kopieren von Dokumentinhalten bzw. den Export in andere Dateiformate durch Verschlüsselung und Einschränkung der Zugriffsrechte verbieten.
Gerade diese beiden für sehende Autoren und Leser vorteilhaften Aspekte ('optisches Erscheinungsbild steht im Vordergrund und ist zunächst unveränderlich' und 'Zugriffsrechte des Benutzers können eingeschränkt werden') sind es, die uns blinden Computernutzern das Leben mit PDF-Dokumenten schwer machen können.
Bei der Arbeit mit dem Computer sind wir auf spezielle Bildschirmvorlesesoftware (sogenannte Screenreader) angewiesen. Diese Programme bereiten die für sehende EDV-Anwender auf dem Computermonitor sichtbare Information auf und präsentieren sie uns mit geeigneten Ausgabemedien: akustisch über eine Sprachausgabe oder tastbar über eine sogenannte Braillezeile.
Die Schwierigkeiten, die wir mit PDF-Dokumenten haben, hängen eng mit der Notwendigkeit zusammen, einen Screenreader benutzen zu müssen – sie lassen sich in drei Problemkreisen zusammenfassen:
- PDF-Dokumente können dem Screenreader keine oder zu wenige Informationen über ihre Struktur geben, da sie diese Informationen nicht oder in zu geringem Maße enthalten oder weil dem Screenreader der Zugriff auf diese Informationen aufgrund von eingeschränkten Benutzerrechten verweigert wird.
- Einzelne Screenreader unterstützen Programme wie den Adobe Reader, mit deren Hilfe PDF-Dokumente gelesen werden könnten, nur mangelhaft.
- Die blinden Benutzer sind im Umgang mit PDF-Dateien nicht genügend geschult.
Ausgehend von diesen Problemkreisen verfolgt der vorliegende Artikel drei Ziele:
- Ich möchte erklären, warum die Tatsache, dass das PDF ein optisches und kein logisches Dokumentenformat ist, dazu führt, dass wir viele PDF-Dateien nicht oder nur unter großen Mühen lesen können.
- Ich möchte erläutern, wie man mit den verschiedenen Screenreadern PDF-Dokumente lesen kann.
- Ich möchte konkret beschreiben, wie man PDF-Dokumente mit Hilfe des Adobe Readers lesen kann oder – falls dies schwierig bzw. unmöglich sein sollte – wie man den Inhalt einer PDF-Datei in ein lesbares Dokumentenformat (Text, Word, z.B.) umwandeln kann.
Um die Probleme, ihre Ursachen und Lösungen zu schildern, muss ich leider eine Menge computertechnisches Detailwissen ansprechen. Damit das nicht so trocken wird, habe ich mich dazu entschlossen, den Artikel in Form eines Dialoges zwischen einem blinden EDV-Berater und einem wissensdurstigen PDF-Neuling zu verfassen.
Rechtliche Hinweise
- Das vorliegende Dokument ist geistiges Eigentum des Autors
Oliver Nadig (Marburg). Es darf für den privaten Gebrauch kostenlos genutzt und beliebig kopiert werden.
- Das Dokument darf nur unverändert und nur kostenlos an Dritte weiter gegeben werden.
- Dritten ist der Vortrag und die Weitergabe des Dokuments im Rahmen von EDV-Schulungen, Seminaren, Workshops, Weiterbildungen und ähnlichen Veranstaltungen nur gestattet, wenn entweder die Teilnahme kostenlos ist oder die entsprechende Veranstaltung von einer Organisation der Blinden- und Sehbehindertenselbsthilfe durchgeführt wird.
- Der Text wurde mit Sorgfalt erstellt, trotzdem sind Irrtümer nicht auszuschließen. Der Autor haftet nicht für eventuelle Fehlinformationen und Schäden, die unmittelbar oder mittelbar durch die Nutzung des vorliegenden Dokumentes entstehen könnten.
Der Beitrag "Lesen, was drinsteht — rausholen, was drinsteckt: Wie blinde Computernutzer sich PDF-Dokumente zugänglich machen" besteht aus folgenden einzelnen Webseiten:
1. Klagelied eines frustrierten PDF-Neulings
Besonders die schlechte Aufbereitung von PDF-Dokumenten verstellt blinden Nutzern oft die selbständige Verwendung der Dokumente.
2. Nützliche Software zum Lesen und Umwandeln von PDF-Dateien
Neben dem Adobe Reader bietet weitere Software die Möglichkeit für Screenreadernutzer, auf den Inhalt von PDF-Dokumenten zuzugreifen.
2.1 Installation und Konfiguration des Adobe Readers
Was blinde und sehbehinderte Nutzer bei der Installation des Adobe Readers beachten müssen. Beschreibung des Installationsvorgangs und der zu beachtenden Einstellungen, damit das Lesen von PDF-Dokumenten optimal gelingt.
2.2 Installation von XPDF
Installation von XPDF bzw. PDFToText mit Hinweisen für blinde und sehbehinderte Nutzer.
2.3 Installation von GhostScript und GSView
GSView und Ghostscript sind für Screenreadernutzer zusätzlich erforderlich zum Adobe Reader, wenn sie PDF-Dokumente mit Sicherheitseinstellungen lesen wollen. Hier finden Sie eine Anleitung zur Installation dieser Software mit Hinweisen zur Bedienung in einem Screenreader.
2.4 Installation und Konfiguration von Omnipage Pro
Zum Lesen von PDF-Dokumenten in einer Sprachausgabe ist die Installation einer OCR-Software für viele Fälle sinnvoll. Installation und Hinweise zu Einstellungen werden hier beschrieben für Omnipage Pro 14.
3. Wann wird welches Programm eingesetzt? — ein Entscheidungsschema
Ein Entscheidungsschema für blinde Nutzer, wann sie welches Programm zum Lesen von PDF-Dokumenten einsetzen sollen. Diese umfassen vor allem den Adobe Reader, OCR-Programmen PDFToText (XPDF) und GSView (Ghostscript).
4. Lesen, was drinsteht: Den Adobe Reader im Griff
Einführung in die Nutzung des Adobe Readers zum Lesen von PDF in Screenreadern.
4.1 Wie Screenreader und Adobe Reader zusammenarbeiten
Wie ein Screenreader mit dem Adobe Reader über MSAA und andere Methoden arbeitet.
4.2 PDF-Dokumente im Adobe Reader lesen
Die Bedienung des Adobe Readers mit der Tastatur ist für Screenreadernutzer wichtig.
4.3 Formularbearbeitung mit dem Adobe Reader
Das Einscannen von Formularen und die Bereitstellung als PDF reicht nicht aus, um die Zugänglichkeit der Formulare herzustellen. Screenreader benötigen die Auszeichnung mit Tags sowie weitere MSAA-Informationen.
4.4 Die Sprachausgabe des Adobe Readers
Die Verwendung der Adobe Reader-Sprachausgabe zum Vorlesen von PDF-Dokumenten und -Formularen erfordert eine SAPI-kompatible Sprachausgabe.
4.5 Weitere Einstellungstipps für den Adobe Reader
Einige Einstellungen sollten im Adobe Reader vorgenommen werden, wenn Screenreader auf PDF-Dokumente besser zugreifen können sollen.
5. Rausholen, was drinsteckt: PDF in Text umwandeln
Es gibt verschiedene Möglichkeiten, aus PDF Textdateien zu erstellen.
5.1 Von PDF nach Text mit dem Adobe Reader
Extrahieren von Text aus einer PDF unter Verwendung eines Screenreaders.
5.2 Von PDF nach Text mit PDFToText
Umwandlung von PDF nach Text mit PDFToText: Was Screenreadernutzer beachten müssen.
5.3 Von PDF nach Text mit GSView
Umwandeln von PDF nach Text mit GSView.
5.4 Von PDF nach Text per Texterkennungsprogramm
Die Verwendung von PDF in Screenreadern ist oft problematisch. Diese Seite beschreibt, wie blinde Nutzer PDF-Dokumente mit einer OCR-Software (Omnipage Pro 12 und 14, An Open Book 6 und 7) in ein zugängliches Format wie Microsoft Word umwandeln können.
5.5 Von PDF nach Text oder HTML per Internet
Umwandlung einer PDF in eine Screenreader-fähigen Datei über einen kostenlosen Web-Service.
6. Noch mehr Hintergrundwissen zu PDF
Hintergrundwissen zu Tagged PDF oder Verschlüsselungsmöglichkeiten kann Screenreadernutzern bei der Interpretation von Fehlermeldungen hilfreich sein.
6.1 Die sieben Versionen des PDF
Probleme im Screenreader bereiten können Konflikte im Zusammenspiel verschiedener Versionen von z.B. PDF-, Adobe Reader und der Verschlüsselungstechnik.
6.2 Verschlüsselt und versiegelt? — Die PDF-Sicherheitseinstellungen
Bei der Verschlüsselung von PDF-Dokumenten ist die richtige Vorgehensweise besonders wichtig, um die Zugänglichkeit für Screenreadernutzer zu gewährleisten.
6.3 PDF mit und ohne Tags
Tags sind beim Lesen und beim Export in andere Formate notwendig, damit Screenreadernutzer die Struktur der Inhalte nachvollziehen können.
6.4 Zur fertigen PDF-Datei auf tausend (Irr)wegen
"Viele Wege führen nach Rom" — aber nur die richtige Technik im PDF-Erstellungsprozess führt zu zugänglichen Dokumenten.
7. Zugänglichkeit von PDF für Blinde: Eine kritische Bilanz
Blinde Nutzer sind bei der Verwendung von PDF-Dokumenten immer noch stark benachteiligt. Hersteller und Autoren könnten diese Situation verbessern.
Weiterführende Literaturhinweise
Einige Artikel/Bücher und Online-Ressourcen zur Barrierefreiheit von PDF.
Über den Autor
Einige Angaben zu Oliver Nadig.
Die folgenden Begriffe dieser Seite werden auch im Glossar definiert: