Lesen, was drinsteht — rausholen, was drinsteckt: Wie blinde Computernutzer sich PDF-Dokumente zugänglich machen geschrieben von Oliver Nadig (2005)
Dieser Beitrag wurde von Oliver Nadig in Oktober 2005 verfasst. Die vorliegende Fassung ist die Version 1.02 vom 25.1.2006.
4.1 Wie Screenreader und Adobe Reader zusammenarbeiten
"Sehende Personen, die beobachten möchten, was ihr Computer gerade tut, holen sich diese Informationen durch einen Blick auf den Monitor. Ein Screenreader, der im Dienste eines blinden EDV-Anwenders das Gleiche tun soll, hat es da sogar noch besser: Auch einem Screenreader stehen Mittel und Wege zur Verfügung, den Inhalt des Computerbildschirms zu analysieren – nicht umsonst heißt Screenreader ja wörtlich 'Bildschirmleser'. Häufig kann ein Screenreader jedoch noch auf zahlreiche andere Informationen zugreifen: Besonders entgegenkommende Programme flüstern dem Bildschirmleser zusätzliche hilfreiche Botschaften zu, die entweder momentan nicht auf dem Bildschirm stehen oder gar nicht für die optische Ausgabe bestimmt sind."
"Könnten Sie mir ein konkretes Beispiel nennen, damit ich mir das besser vorstellen kann?"
"Gerne. Führen Sie zusammen mit einer sehenden Person das folgende Experiment durch (die Sprachausgabe Ihres Screenreaders muss dazu eingeschaltet sein):
- Öffnen Sie den Microsoft Internet Explorer und rufen Sie über die Taste F1 das Hilfesystem auf.
- Das Hilfefenster ist senkrecht in zwei Teile gegliedert. Im linken Teil finden Sie das Inhaltsverzeichnis mit den verfügbaren Hilfebüchern und den darin enthaltenen Hilfethemen. Gehen Sie mit den Pfeiltasten im Inhaltsverzeichnis nach unten, bis Sie auf das Hilfebuch 'Anpassen Ihres Webbrowsers' stoßen und öffnen Sie es durch Betätigen der "Eingabetaste".
- Betätigen Sie dreimal die Taste 'Pfeil-unten'. Ihre Sprachausgabe sollte jetzt die Überschrift eines Hilfethemas vorlesen. Der Überschriftentext lautet: 'Ändern von Schriftarten und Hintergrundfarben bei der Anzeige von Webseiten'. Da dieser Text sehr lang, das linke Teilfenster des Hilfefensters jedoch nicht sehr breit ist, wird der Text rechts abgeschnitten. Dies können Sie eventuell auch mit Hilfe Ihrer Braillezeile erkennen. Während der Sehende auf Ihrem Bildschirm beispielsweise nur 'Ändern von Schriftarten und Hintergrun' lesen kann, sagt die Sprachausgabe den Text vollständig an."
"Faszinierend – und das funktioniert, weil der Internet Explorer meinem Screenreader den gesamten Text 'zuflüstert'?"
"Richtig. Der Internet Explorer und einige andere Screenreader-freundliche Programme bedienen sich dazu einer Technologie namens Microsoft Active Accessibility, abgekürzt MSAA. Dabei muss MSAA gleichzeitig von den freundlichen Programmen und vom eingesetzten Screenreader unterstützt werden. Es ist wie bei einer Sprache: Versteht einer der beiden beteiligten Sprecher die Sprache nicht, kommt keine Kommunikation zustande. Glücklicherweise wird MSAA von allen gängigen Screenreadern unterstützt."
"Was bedeutet das aber im Zusammenhang mit PDF?"
"Ein PDF-Dokument wird vom A.R. zunächst einmal rein grafisch am Bildschirm dargestellt. Nun werden einem eingesetzten Screenreader Informationen über den Inhalt und – falls vorhanden – auch Informationen über die logische Struktur des Dokumentes mit Hilfe der MSAA-Technologie zur Verfügung gestellt. Der Screenreader wertet diese Informationen aus und sorgt dafür, dass Sie das PDF-Dokument über Sprachausgabe und Braillezeile lesen können."
"Ich glaube, jetzt habe ich die Probleme mit PDF-Dateien auch auf technischer Ebene verstanden:
- Ein PDF-Dokument mit einfachem (einspaltigem) Seitenaufbau lässt sich aufgrund der MSAA-Unterstützung des A.R. problemlos mit diesem Programm lesen.
- Bei einem Dokument mit komplizierterem Seitenaufbau reicht die MSAA-Information nicht aus, damit der Screenreader alle Textbestandteile in der richtigen Reihenfolge vorliest. Es fehlen in den meisten Dokumenten nämlich Hinweise über den logischen Aufbau (die sogenannten Tags).
- Wenn der Autor eines Dokumentes die PDF-Sicherheitseinstellungen ungeschickt einsetzt, kann er unbeabsichtigt verhindern, dass sich der A.R. und der Screenreader über MSAA verständigen können – und das Dokument kann nicht gelesen werden.
- Ein rein grafisches PDF-Dokument schließlich enthält gar keine MSAA-Informationen über seinen Inhalt.
- Außer dem A.R. unterstützt kein Betrachterprogramm für PDF-Dokumente die MSAA-Technologie, so dass ich beispielsweise mit Hilfe von GSView eine PDF-Datei nicht direkt lesen kann."
"Besser kann man es gar nicht zusammenfassen!
Die meisten Hersteller von Screenreadern haben das Lesen von PDF-Dateien im A.R. sehr komfortabel gemacht: Sie bauen aus den MSAA-Informationen ein eigenes Dokument zusammen, indem man sich sogar mit einem Cursor komfortabel wie in einem Textverarbeitungsprogramm bewegen kann."
"Heißt das: Im A.R. selbst gibt es gar keinen Cursor?"
"Ebenso wenig wie im Internet Explorer."
"Ich kann mich aber doch auf Webseiten mit den Cursortasten bewegen. Wie kommt denn das?"
"Hier wenden die Entwickler von Screenreadern das gleiche Prinzip wie beim A.R. an: Der Internet Explorer ist genau so ein freundliches Programm wie der A.R. Auch er liefert Informationen über Inhalt und Aufbau der am Bildschirm gezeigten Dokumente (in seinem Falle sind das Webseiten) an Ihr Bildschirmleseprogramm. Dieses baut daraus ein vollkommen neues und zugleich 'blindengerechtes' – Dokument auf, das heißt, es ist braillezeilen- und sprachausgabenfreundlich formatiert; außerdem kann man es mit den Pfeiltasten ähnlich bequem lesen wie ein Dokument in einem Textverarbeitungsprogramm. Einen 'echten' Cursor gibt es im A.R. und im Internet Explorer" nur im Zusammenhang mit der Formularbearbeitung."
"Sie sprachen davon, dass der Screenreader aus den Informationen die er vom A.R. über eine PDF-Datei bzw. vom Internet Explorer über eine Webseite bekommt, ein völlig neues Dokument aufbaut, das 'blindenfreundlich' formatiert ist und über einen Cursor verfügt, den es eigentlich gar nicht gibt. Was hat denn dieses Dokument, das ich mit der Braillezeile und der Sprachausgabe lesen kann, überhaupt noch mit dem zu tun, was der Sehende auf dem Bildschirm sieht?"
"Unter Umständen nicht mehr sehr viel, das kommt aber auf das Dokument und den Screenreader bzw. weitere Hilfsprogramme an. Ich gebe Ihnen mal einen kurzen Überblick:
- Der Screenreader JAWS nennt diese bildschirmunabhängige Dokumentdarstellung 'virtuellen Puffer' und den Cursor 'virtuellen PC-Cursor'. Das Wort 'virtuell' bedeutet so viel wie 'künstlich'. Eine sehende Person, die mit einem JAWS-Benutzer zusammen am Computer sitzt, hat keinen Überblick über das gesamte virtuelle Dokument. Sie kann höchstens den von JAWS zur Verfügung gestellten Braille- Betrachter einschalten und bekommt dann in einem schmalen Fenster immer gerade den Inhalt der Textzeile angezeigt, in der sich der virtuelle Cursor augenblicklich befindet.
- Ähnlich liegen die Verhältnisse beim Screenreader Virgo. Hier heißt die vom eigentlichen Bildschirmgeschehen abgekoppelte Dokumentdarstellung 'DocumentWizard' und der dort verfügbare Cursor 'simulierter Cursor'.
- Den beiden Screenreadern 'Blindows' und 'HAL' wurde von ihren Entwicklern zwar kein virtueller Puffer oder DocumentWizard spendiert; beide Produkte arbeiten jedoch mit einem Programm namens 'WebFormator' zusammen. Den WebFormator kann man sich kostenlos in der aktuellen Version 2.1 von der Webseite
www.webformator.com/deutsch/ herunterladen. Auch der WebFormator baut ein von der Bildschirmdarstellung der PDF-Datei oder Webseite unabhängiges Dokument auf, zeigt dieses im Gegensatz zum virtuellen Puffer von JAWS und dem DocumentWizard von VIRGO aber in einem sichtbaren Fenster an. Dieses Fenster legt sich über das Programmfenster des A.R. bzw. des Internet Explorers, so dass Sehende genau verfolgen können, was dem blinden Benutzer auf der Braillezeile angezeigt und über die Sprachausgabe angesagt wird. Übrigens kann der WebFormator auch zusammen mit JAWS und Virgo eingesetzt werden."
"Nun gibt es ja den A.R., die verschiedenen Screenreader und den WebFormator in unterschiedlichen Versionen. Deshalb möchte ich, bevor wir zu den Tastenkombinationen des A.R. kommen noch schnell fragen, ab welcher Screenreader-Version ich mit welcher Version des A.R. arbeiten kann."
"Mit dem WebFormator können Sie erst ab der aktuellen Version 2.1 PDF-Dokumente lesen und benötigen dazu mindestens den A.R.6. Ab welcher Screenreader-Version welche Version des A.R. unterstützt wird, erläutere ich Ihnen am Besten anhand einer Tabelle:
Name des Screenreaders | Erforderliche Screenreader-Version für Acrobat Reader 5 | Erforderliche Screenreader-Version für Adobe Reader 6 | Erforderliche Screenreader-Version für Adobe Reader 7 |
---|---|---|---|
Blindows (*) | 2.21 (empfohlen: 3.01) | 3.10 | 3.10 |
HAL / SuperNova | 5.11 | 5.20 | 5.20 |
JAWS | 3.71 (empfohlen: 4.02 | 5.0 | 5.0 (empfohlen: 6.1) |
Virgo (*) | 4.4 | 4.4 | 4.4 |
(*) Anwendern von Virgo und Blindows wird seitens der Hersteller empfohlen, PDF-Dokumente mit Hilfe des WebFormators (Version 2.1) zu lesen, der seinerseits mindestens den A.R.6 voraussetzt."
"Darf ich das in diesem Abschnitt Gelernte noch einmal kurz zusammenfassen:"
Zusammenfassung von Abschnitt 4.1
- "Die Darstellung eines PDF-Dokumentes im A.R. ist rein grafisch und kann mit Hilfe eines Screenreaders nur deshalb gelesen werden, weil der A.R. dem Bildschirmleser Informationen über den Textinhalt und – falls vorhanden – Informationen über den logischen Aufbau des Dokumentes über die MSAA-Technologie zur Verfügung stellt.
- Die meisten Screenreader bauen aus den MSAA-Informationen ein eigenständiges, von der Bildschirmdarstellung unabhängiges Dokument auf und stellen in diesem Dokument sogar einen Cursor zum komfortablen Lesen zur Verfügung.
- Der Screenreader JAWS nennt diese bildschirmunabhängige Darstellung 'virtuellen Puffer' und den bereit gestellten Cursor 'virtuellen PC-Cursor'. Bei Virgo heißt die Dokumentdarstellung 'DocumentWizard' und der Cursor 'simulierter Cursor'. Die beiden Screenreader 'HAL / Supernova' und 'Blindows' verfügen über keinen speziellen Anzeigemodus für PDF-Dokumente. Deshalb wird für die beiden letztgenannten Produkte sowie für Virgo der Einsatz des kostenlosen Programms 'WebFormator' empfohlen, das ab der Version 2.1 im Zusammenspiel mit A.R.6 und A.R.7 ebenfalls PDF-Dokumente anzeigen kann."
Der Beitrag Lesen, was drinsteht — rausholen, was drinsteckt: Wie blinde Computernutzer sich PDF-Dokumente zugänglich machen besteht aus folgenden einzelnen Webseiten:
1. Klagelied eines frustrierten PDF-Neulings
Besonders die schlechte Aufbereitung von PDF-Dokumenten verstellt blinden Nutzern oft die selbständige Verwendung der Dokumente.
2. Nützliche Software zum Lesen und Umwandeln von PDF-Dateien
Neben dem Adobe Reader bietet weitere Software die Möglichkeit für Screenreadernutzer, auf den Inhalt von PDF-Dokumenten zuzugreifen.
2.1 Installation und Konfiguration des Adobe Readers
Was blinde und sehbehinderte Nutzer bei der Installation des Adobe Readers beachten müssen. Beschreibung des Installationsvorgangs und der zu beachtenden Einstellungen, damit das Lesen von PDF-Dokumenten optimal gelingt.
2.2 Installation von XPDF
Installation von XPDF bzw. PDFToText mit Hinweisen für blinde und sehbehinderte Nutzer.
2.3 Installation von GhostScript und GSView
GSView und Ghostscript sind für Screenreadernutzer zusätzlich erforderlich zum Adobe Reader, wenn sie PDF-Dokumente mit Sicherheitseinstellungen lesen wollen. Hier finden Sie eine Anleitung zur Installation dieser Software mit Hinweisen zur Bedienung in einem Screenreader.
2.4 Installation und Konfiguration von Omnipage Pro
Zum Lesen von PDF-Dokumenten in einer Sprachausgabe ist die Installation einer OCR-Software für viele Fälle sinnvoll. Installation und Hinweise zu Einstellungen werden hier beschrieben für Omnipage Pro 14.
3. Wann wird welches Programm eingesetzt? — ein Entscheidungsschema
Ein Entscheidungsschema für blinde Nutzer, wann sie welches Programm zum Lesen von PDF-Dokumenten einsetzen sollen. Diese umfassen vor allem den Adobe Reader, OCR-Programmen PDFToText (XPDF) und GSView (Ghostscript).
4. Lesen, was drinsteht: Den Adobe Reader im Griff
Einführung in die Nutzung des Adobe Readers zum Lesen von PDF in Screenreadern.
4.1 Wie Screenreader und Adobe Reader zusammenarbeiten
(Aktuelle Seite)
4.2 PDF-Dokumente im Adobe Reader lesen
Die Bedienung des Adobe Readers mit der Tastatur ist für Screenreadernutzer wichtig.
4.3 Formularbearbeitung mit dem Adobe Reader
Das Einscannen von Formularen und die Bereitstellung als PDF reicht nicht aus, um die Zugänglichkeit der Formulare herzustellen. Screenreader benötigen die Auszeichnung mit Tags sowie weitere MSAA-Informationen.
4.4 Die Sprachausgabe des Adobe Readers
Die Verwendung der Adobe Reader-Sprachausgabe zum Vorlesen von PDF-Dokumenten und -Formularen erfordert eine SAPI-kompatible Sprachausgabe.
4.5 Weitere Einstellungstipps für den Adobe Reader
Einige Einstellungen sollten im Adobe Reader vorgenommen werden, wenn Screenreader auf PDF-Dokumente besser zugreifen können sollen.
5. Rausholen, was drinsteckt: PDF in Text umwandeln
Es gibt verschiedene Möglichkeiten, aus PDF Textdateien zu erstellen.
5.1 Von PDF nach Text mit dem Adobe Reader
Extrahieren von Text aus einer PDF unter Verwendung eines Screenreaders.
5.2 Von PDF nach Text mit PDFToText
Umwandlung von PDF nach Text mit PDFToText: Was Screenreadernutzer beachten müssen.
5.3 Von PDF nach Text mit GSView
Umwandeln von PDF nach Text mit GSView.
5.4 Von PDF nach Text per Texterkennungsprogramm
Die Verwendung von PDF in Screenreadern ist oft problematisch. Diese Seite beschreibt, wie blinde Nutzer PDF-Dokumente mit einer OCR-Software (Omnipage Pro 12 und 14, An Open Book 6 und 7) in ein zugängliches Format wie Microsoft Word umwandeln können.
5.5 Von PDF nach Text oder HTML per Internet
Umwandlung einer PDF in eine Screenreader-fähigen Datei über einen kostenlosen Web-Service.
6. Noch mehr Hintergrundwissen zu PDF
Hintergrundwissen zu Tagged PDF oder Verschlüsselungsmöglichkeiten kann Screenreadernutzern bei der Interpretation von Fehlermeldungen hilfreich sein.
6.1 Die sieben Versionen des PDF
Probleme im Screenreader bereiten können Konflikte im Zusammenspiel verschiedener Versionen von z.B. PDF-, Adobe Reader und der Verschlüsselungstechnik.
6.2 Verschlüsselt und versiegelt? — Die PDF-Sicherheitseinstellungen
Bei der Verschlüsselung von PDF-Dokumenten ist die richtige Vorgehensweise besonders wichtig, um die Zugänglichkeit für Screenreadernutzer zu gewährleisten.
6.3 PDF mit und ohne Tags
Tags sind beim Lesen und beim Export in andere Formate notwendig, damit Screenreadernutzer die Struktur der Inhalte nachvollziehen können.
6.4 Zur fertigen PDF-Datei auf tausend (Irr)wegen
"Viele Wege führen nach Rom" — aber nur die richtige Technik im PDF-Erstellungsprozess führt zu zugänglichen Dokumenten.
7. Zugänglichkeit von PDF für Blinde: Eine kritische Bilanz
Blinde Nutzer sind bei der Verwendung von PDF-Dokumenten immer noch stark benachteiligt. Hersteller und Autoren könnten diese Situation verbessern.
Weiterführende Literaturhinweise
Einige Artikel/Bücher und Online-Ressourcen zur Barrierefreiheit von PDF.
Über den Autor
Einige Angaben zu Oliver Nadig.
Die folgenden Begriffe dieser Seite werden auch im Glossar definiert: