Lesen, was drinsteht — rausholen, was drinsteckt: Wie blinde Computernutzer sich PDF-Dokumente zugänglich machen geschrieben von Oliver Nadig (2005)
Dieser Beitrag wurde von Oliver Nadig in Oktober 2005 verfasst. Die vorliegende Fassung ist die Version 1.02 vom 25.1.2006.
4.4 Die Sprachausgabe des Adobe Readers
"Um es gleich vorweg zu nehmen: A.R.6 und A.R.7 bringen keine eigene Sprachausgabe, sondern lediglich Sprachausgabefunktionen mit. Um diese Funktionen zu nutzen, muss auf Ihrem Computer bereits eine Sprachausgabe installiert sein, die der A.R. verwenden kann."
"Heißt das: Es gibt auch Sprachausgaben, die der A.R. nicht nutzen kann?"
"Ja. Eine Sprachausgabe, die vom A.R. genutzt werden kann, muss SAPI4- oder SAPI5-kompatibel sein. SAPI ist die Abkürzung für die englische Bezeichnung 'Speech Application Programming Interface'. Das könnte man mit 'Anwendungsprogrammierschnittstelle für Sprache' ins Deutsche übersetzen. SAPI muss sowohl von einem Anwendungsprogramm als auch von der Sprachausgabe unterstützt werden. Ist das der Fall, kann ein Anwendungsprogramm Text an eine Sprachausgabe senden, der dann laut vorgelesen wird. Außerdem kann das Programm über SAPI Einstellungen der Sprachausgabe verändern, zum Beispiel die Tonhöhe, die Geschwindigkeit, die Lautstärke oder die Betonung, mit der die Sprachausgabe spricht. SAPI gibt es in verschiedenen Versionen. Ihr Betriebssystem Windows XP arbeitet standardmäßig mit der Version SAPI 5.1, die man vereinfachend auch als SAPI5 bezeichnet.Windows 98 und Windows 2000 verfügen standardmäßig über die Version 'SAPI 4.0'. A.R.6 und A.R.7 unterstützen SAPI4 und SAPI5. Computeranwender, die zwar keinen Screenreader besitzen, dafür aber eine SAPI5-kompatible Sprachausgabe auf ihrem System installiert haben, können sich deshalb PDF-Dokumente oder einzelne Seiten daraus vorlesen lassen.
Nicht alle Sprachausgaben, die Sie installieren, unterstützen jedoch SAPI, selbst wenn sie es theoretisch könnten. Die Sprachausgabe 'Eloquence', die mit dem Screenreader JAWS ausgeliefert wird, lässt sich nicht über SAPI ansteuern und deshalb auch nicht vom A.R. verwenden. Wenn Sie aber zum Beispiel die Version 12 des Texterkennungsprogramms Omnipage Pro auf Ihrem System haben, verfügen Sie über die SAPI5-kompatible Sprachausgabe 'Vera'; Befindet sich das Texterkennungsprogramm Openbook in der Version 6 oder 7 auf Ihrem Computer, wurde die SAPI5-kompatible Sprachausgabe 'IBM ViaVoice' ebenfalls installiert. der A.R. erkennt auf Ihrem Windows 98- oder Windows 2000-Rechner alle SAPI4- und auf Ihrem Windows XP-Rechner alle SAPI5-kompatiblen Sprachausgaben. Sind mehrere Sprachausgaben vorhanden, nutzt A.R. diejenige, die auf Ihrem System als Standardsprachausgabe festgelegt wurde. Unter Windows XP ist das leider fast immer die englischsprachige Systemsprachausgabe von Microsoft, die Ihnen deutsche Texte mit englischer Betonung vorliest. Dies trägt natürlich nicht gerade zur Verständlichkeit bei. Wenn Sie über eine deutsche SAPI4/5-kompatible Sprachausgabe verfügen, stellen Sie diese als Sprachausgabe für den A.R. ein. Gehen Sie dazu wie folgt vor:
- Öffnen Sie im A.R. über den Menüpunkt 'Bearbeiten > Grundeinstellungen' oder die Tastenkombination STRG+K den Dialog 'Grundeinstellungen'.
- Wechseln Sie mit den Pfeiltasten in die Einstellungskategorie 'Lesen'
- Deaktivieren Sie das Kontrollfeld 'Standardstimme verwenden'; dadurch wird eine Liste aller mit dem A.R. nutzbaren Sprachausgaben verfügbar.
- Wählen Sie in der Liste 'Stimme' die Stimme einer deutschen Sprachausgabe aus und bestätigen Sie den Grundeinstellungsdialog mit 'OK'.
Wenn Sie noch keine deutsche Sprachausgabe besitzen, können Sie gezielt eine erwerben oder erhalten sie automatisch zusammen mit anderen Anwendungen wie beispielsweise den Texterkennungsprogrammen Omnipage Pro 12 (nicht Version 14!) oder Openbook (Versionen 6 oder 7). Wird keine SAPI-kompatible Sprachausgabe auf Ihrem System gefunden, steht die Sprachausgabefunktion in A.R. natürlich nicht zur Verfügung."
"Angenommen, auf meinem Computer wären alle Voraussetzungen erfüllt, die Sprachfunktionen des A.R. zu nutzen. Was kann ich dann damit anfangen?"
"Dann stehen Ihnen vier interessante Funktionen zur Verfügung:
- Zum Lesen der aktuellen Seite rufen Sie den Menüpunkt 'Ansicht > Sprachausgabe > Nur diese Seite lesen' auf oder drücken die Tastenkombination STRG+UMSCHALT+V.
- Um beginnend von der aktuellen Seite bis zum Dokumentende zu lesen, rufen Sie den Menüpunkt 'Ansicht > Sprachausgabe > Bis zum Ende des Dokuments lesen' auf oder drücken die Tastenkombination STRG+UMSCHALT+B.
- Um das laufende Vorlesen vorübergehend zu unterbrechen (Pause-Funktion), rufen Sie den Menüpunkt 'Ansicht > Sprachausgabe > Anhalten' auf oder drücken die Tastenkombination STRG+UMSCHALT+C.
- Um die Sprachausgabe endgültig zu stoppen, rufen Sie den Menüpunkt 'Ansicht > Sprachausgabe > Stoppen' auf oder drücken die Tastenkombination STRG+UMSCHALT+E."
"Sie sprachen eben kurz von der Einstellungskategorie 'Lesen' im Grundeinstellungsdialog des A.R. Welche weiteren Optionen gibt es denn außerdem darin?"
"Zunächst einmal finden Sie darin die Einstellungen wieder, die Ihnen bereits während der Installation des A.R.7 in Schritt 3 des Ausgabehilfeassistenten gezeigt worden sind; danach folgen weitere spezielle Einstellungen für die Sprachausgabefunktionen:
- In der Liste 'Leserichtung' legen Sie für Dokumente, die keine Tags enthalten fest, wie der A.R. die Lesefolge für die Textblöcke einer Dokumentseite zu ermitteln versucht: Bei der vorgewählten Option 'Leserichtung aus Dokument ableiten (empfohlen)' wird die Lesefolge anhand des Textflusses und des Schriftverlaufes abgeleitet. Alternativ können Sie 'Leserichtung von links nach rechts, von oben nach unten' oder 'Leserichtung in Druckdatenstrom verwenden' einstellen. In der Praxis hat sich die empfohlene Option bewährt. Wenn der A.R. beim Vorlesen des Textes jedoch Absätze durcheinanderwürfelt und Tabellen 'zerpflückt', müssen Sie mit den Einstellungen für die Leserichtung experimentieren.
- Bei Dokumenten, die Tags enthalten, kann der A.R. die durch die Tags vorgegebene Lesereihenfolge ignorieren und stattdessen die in der vorangehenden Liste festgelegte Leserichtung verwenden. Dies wird allerdings nicht empfohlen, deshalb sollten Sie das Kontrollfeld 'Leserichtung in Dokumenten mit Tags überschreiben' deaktiviert lassen.
- In der Liste 'Seite und Dokument' stellen Sie ein, in welchen Portionen der Inhalt des PDF-Dokumentes über MSAA an den Screenreader übermittelt wird. Die 'Portionsgrößen' können entscheidend dafür sein, ob der Screenreader das Dokument flüssig vorliest, ob man beim Umblättern länger auf eine Reaktion der Sprachausgabe warten muss oder ob der Screenreader sogar wegen 'Überfütterung' abstürzt. Die voreingestellte Option 'Bei großen Dokumenten nur momentan sichtbare Seiten lesen' ist sehr sinnvoll. Wenn Sie diese Einstellung verwenden, müssen Sie beim Lesen eines PDF-Dokumentes allerdings nach jeder Seite mit der Tastenkombination STRG+BILD-AB die nächste Dokumentseite an den Screenreader übergeben. Dies ist zwar ein wenig unkomfortabel, sorgt aber für eine reibungslose Zusammenarbeit zwischen Ihrem Bildschirmleseprogramm und dem A.R. Hingegen bestünde bei Verwendung der Option 'Gesamtes Dokument lesen' die Gefahr der Überfütterung des Screenreaders und bei 'Nur momentan sichtbare Seiten lesen' würde er sich bei kleinen Dokumenten unterfordert fühlen.
- Wenn Sie in der soeben besprochenen Liste die Voreinstellung 'Bei großen Dokumenten nur momentan sichtbare Seiten lesen' beibehalten haben, ist danach das Eingabefeld 'Minimale Seitenanzahl in einem großen Dokument' verfügbar. Hier können Sie angeben, ab wie vielen Seiten ein PDF-Dokument als 'groß' gelten soll. Die Praxis hat gezeigt, dass der hier voreingestellte Wert von 50 zu groß ist. Geben Sie am Besten die Zahl 10 ein.
- Der A.R. kann versuchen, ein Dokument ohne Tags nachträglich zu 'taggen'. Dies sollte man aber dem Programm bei Bedarf gestatten und nicht automatisch erlauben. Lassen Sie deshalb das Kontrollfeld 'Tags nur nach vorheriger Bestätigung in Dokumenten einfügen' aktiviert.
- In der Liste 'Lautstärke' legen Sie die Lautstärke der verwendeten Sprachausgabe fest. Standardwert ist 7.
- Der A.R. ist so voreingestellt, dass er beim Vorlesen die Standardsprachausgabe des Systems benutzt. Möchten Sie dies nicht (weil das entweder eine englische Sprachausgabe ist oder Sie die Stimme schlecht verstehen), sollten Sie das Kontrollfeld 'Standardstimme verwenden' deaktivieren.
- Wenn Sie das Kontrollfeld 'Standardstimme verwenden' deaktivieren, ist die Liste 'Stimme' verfügbar, aus der Sie eine auf Ihrem System verfügbare SAPI5-kompatible Sprachausgabenstimme auswählen können. Beachten Sie, dass diese Liste leer ist, wenn Sie keine SAPI5-kompatible Sprachausgabe installiert haben.
- Jede Stimme verfügt über eine standardmäßige Tonhöhe und eine Standardgeschwindigkeit. Der A.R. ist so voreingestellt, dass er die zum Vorlesen verwendete Stimme mit diesen Standardattributen sprechen lässt. Möchten Sie selbst Tonhöhe und Sprechgeschwindigkeit der Lesestimme festlegen, deaktivieren Sie das Kontrollfeld 'Standardsprachattribute verwenden'.
- Haben Sie das Kontrollfeld 'Standardsprachattribute verwenden' deaktiviert, ist erstens die Liste 'Tonhöhe' und zweitens das Eingabefeld 'Wörter pro Minute' verfügbar. Legen Sie darin Tonhöhe und Sprechgeschwindigkeit der verwendeten Lesestimme fest.
- Über das Kontrollfeld 'Formularfelder lesen' legen Sie fest, ob Typ und Inhalt von Formularfeldern automatisch vorgelesen werden sollen oder nicht. Im vorangegangenen
Abschnitt 4.3 habe ich Ihnen empfohlen, das Kontrollfeld ruhig zu aktivieren um zu testen, ob entweder Ihr Screenreader oder die vom A.R. gesteuerte Sprachausgabe mehr Informationen aus PDF-Formularen herausholt."
Der Beitrag Lesen, was drinsteht — rausholen, was drinsteckt: Wie blinde Computernutzer sich PDF-Dokumente zugänglich machen besteht aus folgenden einzelnen Webseiten:
1. Klagelied eines frustrierten PDF-Neulings
Besonders die schlechte Aufbereitung von PDF-Dokumenten verstellt blinden Nutzern oft die selbständige Verwendung der Dokumente.
2. Nützliche Software zum Lesen und Umwandeln von PDF-Dateien
Neben dem Adobe Reader bietet weitere Software die Möglichkeit für Screenreadernutzer, auf den Inhalt von PDF-Dokumenten zuzugreifen.
2.1 Installation und Konfiguration des Adobe Readers
Was blinde und sehbehinderte Nutzer bei der Installation des Adobe Readers beachten müssen. Beschreibung des Installationsvorgangs und der zu beachtenden Einstellungen, damit das Lesen von PDF-Dokumenten optimal gelingt.
2.2 Installation von XPDF
Installation von XPDF bzw. PDFToText mit Hinweisen für blinde und sehbehinderte Nutzer.
2.3 Installation von GhostScript und GSView
GSView und Ghostscript sind für Screenreadernutzer zusätzlich erforderlich zum Adobe Reader, wenn sie PDF-Dokumente mit Sicherheitseinstellungen lesen wollen. Hier finden Sie eine Anleitung zur Installation dieser Software mit Hinweisen zur Bedienung in einem Screenreader.
2.4 Installation und Konfiguration von Omnipage Pro
Zum Lesen von PDF-Dokumenten in einer Sprachausgabe ist die Installation einer OCR-Software für viele Fälle sinnvoll. Installation und Hinweise zu Einstellungen werden hier beschrieben für Omnipage Pro 14.
3. Wann wird welches Programm eingesetzt? — ein Entscheidungsschema
Ein Entscheidungsschema für blinde Nutzer, wann sie welches Programm zum Lesen von PDF-Dokumenten einsetzen sollen. Diese umfassen vor allem den Adobe Reader, OCR-Programmen PDFToText (XPDF) und GSView (Ghostscript).
4. Lesen, was drinsteht: Den Adobe Reader im Griff
Einführung in die Nutzung des Adobe Readers zum Lesen von PDF in Screenreadern.
4.1 Wie Screenreader und Adobe Reader zusammenarbeiten
Wie ein Screenreader mit dem Adobe Reader über MSAA und andere Methoden arbeitet.
4.2 PDF-Dokumente im Adobe Reader lesen
Die Bedienung des Adobe Readers mit der Tastatur ist für Screenreadernutzer wichtig.
4.3 Formularbearbeitung mit dem Adobe Reader
Das Einscannen von Formularen und die Bereitstellung als PDF reicht nicht aus, um die Zugänglichkeit der Formulare herzustellen. Screenreader benötigen die Auszeichnung mit Tags sowie weitere MSAA-Informationen.
4.4 Die Sprachausgabe des Adobe Readers
(Aktuelle Seite)
4.5 Weitere Einstellungstipps für den Adobe Reader
Einige Einstellungen sollten im Adobe Reader vorgenommen werden, wenn Screenreader auf PDF-Dokumente besser zugreifen können sollen.
5. Rausholen, was drinsteckt: PDF in Text umwandeln
Es gibt verschiedene Möglichkeiten, aus PDF Textdateien zu erstellen.
5.1 Von PDF nach Text mit dem Adobe Reader
Extrahieren von Text aus einer PDF unter Verwendung eines Screenreaders.
5.2 Von PDF nach Text mit PDFToText
Umwandlung von PDF nach Text mit PDFToText: Was Screenreadernutzer beachten müssen.
5.3 Von PDF nach Text mit GSView
Umwandeln von PDF nach Text mit GSView.
5.4 Von PDF nach Text per Texterkennungsprogramm
Die Verwendung von PDF in Screenreadern ist oft problematisch. Diese Seite beschreibt, wie blinde Nutzer PDF-Dokumente mit einer OCR-Software (Omnipage Pro 12 und 14, An Open Book 6 und 7) in ein zugängliches Format wie Microsoft Word umwandeln können.
5.5 Von PDF nach Text oder HTML per Internet
Umwandlung einer PDF in eine Screenreader-fähigen Datei über einen kostenlosen Web-Service.
6. Noch mehr Hintergrundwissen zu PDF
Hintergrundwissen zu Tagged PDF oder Verschlüsselungsmöglichkeiten kann Screenreadernutzern bei der Interpretation von Fehlermeldungen hilfreich sein.
6.1 Die sieben Versionen des PDF
Probleme im Screenreader bereiten können Konflikte im Zusammenspiel verschiedener Versionen von z.B. PDF-, Adobe Reader und der Verschlüsselungstechnik.
6.2 Verschlüsselt und versiegelt? — Die PDF-Sicherheitseinstellungen
Bei der Verschlüsselung von PDF-Dokumenten ist die richtige Vorgehensweise besonders wichtig, um die Zugänglichkeit für Screenreadernutzer zu gewährleisten.
6.3 PDF mit und ohne Tags
Tags sind beim Lesen und beim Export in andere Formate notwendig, damit Screenreadernutzer die Struktur der Inhalte nachvollziehen können.
6.4 Zur fertigen PDF-Datei auf tausend (Irr)wegen
"Viele Wege führen nach Rom" — aber nur die richtige Technik im PDF-Erstellungsprozess führt zu zugänglichen Dokumenten.
7. Zugänglichkeit von PDF für Blinde: Eine kritische Bilanz
Blinde Nutzer sind bei der Verwendung von PDF-Dokumenten immer noch stark benachteiligt. Hersteller und Autoren könnten diese Situation verbessern.
Weiterführende Literaturhinweise
Einige Artikel/Bücher und Online-Ressourcen zur Barrierefreiheit von PDF.
Über den Autor
Einige Angaben zu Oliver Nadig.
Die folgenden Begriffe dieser Seite werden auch im Glossar definiert: