Lesen, was drinsteht — rausholen, was drinsteckt: Wie blinde Computernutzer sich PDF-Dokumente zugänglich machen geschrieben von Oliver Nadig (2005)
Dieser Beitrag wurde von Oliver Nadig in Oktober 2005 verfasst. Die vorliegende Fassung ist die Version 1.02 vom 25.1.2006.
6.3 PDF mit und ohne Tags
"Sie wissen, dass der Inhalt einer PDF-Datei mit Hilfe von Tags logisch strukturiert werden kann. Beachten Sie: Die An- oder Abwesenheit von Tags wirkt sich nicht auf die visuelle Präsentation am Bildschirm aus. Sie beeinflusst drei für uns Screenreader-Benutzer wichtige Aspekte:
- In welcher Reihenfolge die Dokumentbestandteile von einem Bildschirmleser über Sprachausgabe oder Braillezeile dargestellt werden,
- ob beim Umwandeln von PDF in ein anderes Dokumentformat sämtliche Dokumentbestandteile berücksichtigt und in der richtigen Reihenfolge konvertiert werden,
- ob das Dokument korrekt umfließt, wenn sehbehinderte A.R.-Nutzer die Anzeige vergrößern.
Verwechseln Sie Tags bitte nicht mit Lesezeichen. In langen Dokumenten dürfen Lesezeichen nicht fehlen, um die Navigation zu ermöglichen.
Damit Sie sich jetzt aber besser vorstellen können, was man unter einem Tag versteht, bringe ich ein praktisches Beispiel:
In Abschnitt 4.2 unserer Unterhaltung findet sich der Text 'Umschalten vom Navigationsfenster in den Dokumentbereich'. Dieser Text ist Teil einer Tabelle, in der es um Tastenkombinationen zur Bedienung des A.R. geht; genauer gesagt: der Text befindet sich in Zeile 3, Spalte 3 der ersten (und einzigen) Tabelle des genannten Abschnittes. Wir wollen einmal nachvollziehen, wie die Information 'Der angegebene Text befindet sich in Zeile 3, Spalte 3 der ersten Tabelle von Abschnitt 4.2' mit Hilfe eines Tags dargestellt wird:
- Die logische Struktur eines Dokumentes, und damit auch die Struktur von Tags, gliedert sich in mehrere Ebenen, ist also immer hierarchisch aufgebaut. Hierarchien lassen sich sehr gut mit Hilfe von Baumstrukturen veranschaulichen. Entsprechend gehört zu jedem 'getaggten' PDF-Dokument ein sogenannter 'Tag-Baum'.
- Die Wurzel des Tag-Baumes bildet das Dokument, den 'Stamm' des Tag-Baumes bilden in der Regel die einzelnen Dokumentseiten.
- In gut strukturierten Dokumenten werden zur Gliederung verschiedene Überschriften-Ebenen eingesetzt. Im vorliegenden Text stehen das Inhaltsverzeichnis und die Überschriften der Kapitel auf Ebene eins, während die Überschriften der Abschnitte auf Ebene zwei und die Überschriften der Unterabschnitte (gibt es im vorliegenden Dokument nur in Abschnitt 5.3 und Abschnitt 6.4) auf Ebene drei angesiedelt sind.
- Den Inhalt von Abschnitt 4.2 finden wir also im Tag-Baum, indem wir nach dem vierten Überschriftenelement der Ebene Eins Ausschau halten, bei diesem Element in die nächst tiefere Baum-Ebene absteigen und uns dort zur zweiten Überschrift der Ebene Zwei bewegen.
- Der Inhalt von Abschnitt 4.2 ist wiederum untergliedert: Mehrere Textabsätze stehen auf hierarchisch gleicher Ebene nebeneinander. Es gibt aber auch eine Tabelle, die wiederum über Unterstrukturen verfügt: Die Tabelle, die den gesuchten Text 'Umschalten vom Navigationsfenster in den Dokumentbereich' enthält, gliedert sich in Zeilen, die wiederum aus Tabellenzellen aufgebaut sind. Beim angegebenen Text handelt es sich um den Inhalt der ersten Zelle in Tabellenzeile drei.
Fazit: Der Text 'Umschalten vom Navigationsfenster in den Dokumentbereich' ist mit einem Tag versehen, der ihn strukturell als Inhalt der ersten Zelle in der dritten Zeile in der ersten Tabelle in Abschnitt zwei in Kapitel vier des vorliegenden Textes auszeichnet."
"Ich denke, dass ich verstanden habe: Wenn ein PDF-Dokument 'getaggt' ist, kann mein Screenreader die in den Tags enthaltene Information dazu nutzen, die Dokumentbestandteile gezielt an zu springen und mir die strukturierte Navigation zwischen ihnen zu ermöglichen. So kann ich etwa – unter Hinzuziehung von Lesezeichen – die Überschrift von Abschnitt 4.2 aufsuchen und danach zur nächst folgenden Tabelle springen."
"Genauso ist es. Wäre das Dokument 'ungetaggt', könnte ein sehender Computernutzer sicher anhand des Dokumentlayouts feststellen, dass sich in Abschnitt 4.2 eine Tabelle befindet. Ihr Screenreader wüsste jedoch nichts von dieser Tabellenstruktur. Sie hätten nicht die Möglichkeit, sich innerhalb der Tabelle von Zeile zu Zeile oder von Spalte zu Spalte zu bewegen und Ihre Sprachausgabe würde den Inhalt der Tabelle vorlesen, wie einen unstrukturierten Fließtext."
Der Beitrag Lesen, was drinsteht — rausholen, was drinsteckt: Wie blinde Computernutzer sich PDF-Dokumente zugänglich machen besteht aus folgenden einzelnen Webseiten: Besonders die schlechte Aufbereitung von PDF-Dokumenten verstellt blinden Nutzern oft die selbständige Verwendung der Dokumente. Neben dem Adobe Reader bietet weitere Software die Möglichkeit für Screenreadernutzer, auf den Inhalt von PDF-Dokumenten zuzugreifen. Was blinde und sehbehinderte Nutzer bei der Installation des Adobe Readers beachten müssen. Beschreibung des Installationsvorgangs und der zu beachtenden Einstellungen, damit das Lesen von PDF-Dokumenten optimal gelingt. Installation von XPDF bzw. PDFToText mit Hinweisen für blinde und sehbehinderte Nutzer. GSView und Ghostscript sind für Screenreadernutzer zusätzlich erforderlich zum Adobe Reader, wenn sie PDF-Dokumente mit Sicherheitseinstellungen lesen wollen. Hier finden Sie eine Anleitung zur Installation dieser Software mit Hinweisen zur Bedienung in einem Screenreader. Zum Lesen von PDF-Dokumenten in einer Sprachausgabe ist die Installation einer OCR-Software für viele Fälle sinnvoll. Installation und Hinweise zu Einstellungen werden hier beschrieben für Omnipage Pro 14. Ein Entscheidungsschema für blinde Nutzer, wann sie welches Programm zum Lesen von PDF-Dokumenten einsetzen sollen. Diese umfassen vor allem den Adobe Reader, OCR-Programmen PDFToText (XPDF) und GSView (Ghostscript). Einführung in die Nutzung des Adobe Readers zum Lesen von PDF in Screenreadern. Wie ein Screenreader mit dem Adobe Reader über MSAA und andere Methoden arbeitet. Die Bedienung des Adobe Readers mit der Tastatur ist für Screenreadernutzer wichtig. Das Einscannen von Formularen und die Bereitstellung als PDF reicht nicht aus, um die Zugänglichkeit der Formulare herzustellen. Screenreader benötigen die Auszeichnung mit Tags sowie weitere MSAA-Informationen. Die Verwendung der Adobe Reader-Sprachausgabe zum Vorlesen von PDF-Dokumenten und -Formularen erfordert eine SAPI-kompatible Sprachausgabe. Einige Einstellungen sollten im Adobe Reader vorgenommen werden, wenn Screenreader auf PDF-Dokumente besser zugreifen können sollen. Es gibt verschiedene Möglichkeiten, aus PDF Textdateien zu erstellen. Extrahieren von Text aus einer PDF unter Verwendung eines Screenreaders. Umwandlung von PDF nach Text mit PDFToText: Was Screenreadernutzer beachten müssen. Umwandeln von PDF nach Text mit GSView. Die Verwendung von PDF in Screenreadern ist oft problematisch. Diese Seite beschreibt, wie blinde Nutzer PDF-Dokumente mit einer OCR-Software (Omnipage Pro 12 und 14, An Open Book 6 und 7) in ein zugängliches Format wie Microsoft Word umwandeln können. Umwandlung einer PDF in eine Screenreader-fähigen Datei über einen kostenlosen Web-Service. Hintergrundwissen zu Tagged PDF oder Verschlüsselungsmöglichkeiten kann Screenreadernutzern bei der Interpretation von Fehlermeldungen hilfreich sein. Probleme im Screenreader bereiten können Konflikte im Zusammenspiel verschiedener Versionen von z.B. PDF-, Adobe Reader und der Verschlüsselungstechnik. Bei der Verschlüsselung von PDF-Dokumenten ist die richtige Vorgehensweise besonders wichtig, um die Zugänglichkeit für Screenreadernutzer zu gewährleisten. (Aktuelle Seite) "Viele Wege führen nach Rom" — aber nur die richtige Technik im PDF-Erstellungsprozess führt zu zugänglichen Dokumenten. Blinde Nutzer sind bei der Verwendung von PDF-Dokumenten immer noch stark benachteiligt. Hersteller und Autoren könnten diese Situation verbessern. Einige Artikel/Bücher und Online-Ressourcen zur Barrierefreiheit von PDF. Einige Angaben zu Oliver Nadig. Die folgenden Begriffe dieser Seite werden auch im Glossar definiert:
Blättern zur nächsten oder vorherigen Seite