Lesen, was drinsteht — rausholen, was drinsteckt: Wie blinde Computernutzer sich PDF-Dokumente zugänglich machen geschrieben von Oliver Nadig (2005)
Dieser Beitrag wurde von Oliver Nadig in Oktober 2005 verfasst. Die vorliegende Fassung ist die Version 1.02 vom 25.1.2006.
6.1 Die sieben Versionen des PDF
"Vielleicht hat Sie der folgende Satz aus Abschnitt Abschnitt 5.3 etwas irritiert: 'Die derzeit aktuelle Version 3.01 von PDFToText unterstützt die neueste Version 1.6 von PDF noch nicht direkt.' Dass Programme in Verschiedenen Versionen vorliegen, mag Ihnen einleuchten, aber dass Dokumentformate wie das PDF in mehreren Versionen existieren, mag Ihnen zunächst befremdlich erscheinen – ist es aber nicht, denn genau wie Programme, so werden auch Dateiformate stets weiter entwickelt.
Die derzeit aktuelle PDF-Version aus dem Jahre 2004 ist '1.6', aber beginnen wir chronologisch:
- Alles fing 1993 mit der Version 'PDF ' an, die von den Acrobat-Softwareprodukten der Version eins unterstützt wurde. Außer der optisch attraktiven Darstellung von Text konnte diese PDF-Version noch nicht sehr viel: Es war möglich, Lesezeichen und dateiinterne Querverweise in ein PDF-Dokument ein zu betten.
- Bereits 1994 folgten: Die PDF-Version 1.1 und die Acrobat-Produkte in der Version 2. PDF 1.0 unterstützte bereits externe Querverweise und die Einbettung von Multimedia-Dateien in älteren Sound- und Video-Formaten. Zusätzlich konnten die Dokumente durchsucht werden.
- 1995 kamen die PDF-Version 1.2 und die Acrobat-Produkte in der Version drei auf den Markt. Neu war die Möglichkeit der Verwendung des CMYK-Farbsystems. Außerdem konnten PDF-Dateien jetzt durch die Unterstützung von Browser-Erweiterungen (sogenannten PlugIns) direkt aus dem Internet heraus aufgerufen werden. Die Firma Adobe Systems spendierte Screenreader-Nutzern ein spezielles Zugänglichkeits-Plugin für den A.R.3. Mit diesem Accessibility Plugin war es blinden Computernutzern erstmals in der Geschichte des PDF möglich, derartige Dateien zu lesen.
- Die PDF-Version 1.3 und die Acrobat-Produkte in der Version 4 ließen bis 1999 auf sich warten. Neu in PDF 1.3 war die Unterstützung asiatischer Schriften. Das Accessibility Plugin für den A.R.4 wurde verbessert.
- Die Einführung von PDF in der Version 1.4 und der Acrobat-Produkte in der Version 5 im Jahre 2001 brachten für Screenreader-Benutzer drei entscheidende Veränderungen:
- Ein Accessibility Plugin gab es nicht mehr, dafür unterstützte der A.R.5 nun MSAA. Die Firma Adobe Systems forderte die Screenreader-Hersteller auf, fortan selbst für die direkte Unterstützung des A.R. zu sorgen.
- Konnten PDF-Dokumente bis zur PDF-Version 1.3 nur mit einer schwachen Verschlüsselung von 40-Bit gegen unbefugten Zugriff geschützt werden, so unterstützte PDF 1.4 nun die starke 128-Bit-Verschlüsselung. Was dies für die Lesbarkeit zugriffseingeschränkter PDF-Dateien im Einzelnen bedeutet, erörtern wir in Abschnitt 6.2 Verschlüsselt und versiegelt? — Die PDF-Sicherheitseinstellungen.
- Enthielten PDF-Dokumente bis zur PDF-Version 1.3 lediglich Layout- aber keine Strukturinformationen, so wurde es in der PDF-Version 1.4 erstmals möglich, mit Hilfe spezieller Markierungen, den sogenannten Tags, den logischen Dokumentaufbau zu beschreiben. Tags verbessern nicht nur die Lesbarkeit von PDF-Dokumenten für Screenreader, sie sorgen auch bei einer Umwandlung von PDF in andere Dokumentenformate für bessere Konvertierungsergebnisse. Mit dem Thema Tags setzen wir uns ausführlich in Abschnitt 6.3 PDF mit und ohne Tags auseinander.
- Die Erweiterungen der PDF-Version 1.5 und der Acrobat-Produkte der Version 6 aus dem Jahre 2003 brachten Neuerungen vor allem im Grafik-, Video- und Sound-Bereich: Bilder im Format JPEG2000, Filme im Format MPEG und Audiodateien im Format MP3 konnten jetzt in PDF-Dateien eingebettet werden. Aus dem Acrobat Reader wurde der Adobe Reader, dem die Herstellerfirma einige zusätzliche Optionen für Sehbehinderte und Blinde sowie Sprachausgabefunktionen spendierte.
- Im Jahre 2004 kamen dann die derzeit aktuelle Version 1.6 des PDF und die Versionen sieben der Acrobat-Produkte heraus. Der A.R.7 kann nun auf Wunsch unzugängliche PDF-Dokumente vorübergehend mit Tags versehen, liest mehrspaltige Dokumente sehr viel besser und kann Formularfelder mit Hilfe seiner Sprachausgabefunktionen direkt vorlesen. Ein Ausgabehilfeassistent unterstützt den Benutzer beim Optimieren der Programmeinstellungen für die Zusammenarbeit mit Screenreadern und Bildschirmvergrößerungsprogrammen."
"Sieht ja so aus, als ob die Firma Adobe Systems gerade in den letzten beiden Jahren große Anstrengungen unternommen hätte, PDF-Dokumente für uns Blinde leichter handhabbar zu machen."
"Das stimmt, und man sollte dies lobend anerkennen. Leider ist das aber nur die eine Seite der Medaille: Schlecht produzierten PDF-Dokumenten ohne Tags – und davon gibt es unzählig viele – stehen ein noch so zugänglicher A.R., ein noch so leistungsfähiger Screenreader und ein noch so gut geschulter blinder Computernutzer machtlos gegenüber."
"Dann muss man bei den PDF-Autoren also noch eine Menge Aufklärungsarbeit leisten!"
"Richtig! Bis vor Kurzem galt außerdem, dass Software, mit deren Hilfe Tagged PDF erzeugt werden kann, sehr teuer ist, denn dazu waren einzig und allein Produkte der Firma Adobe selbst in der Lage. Mittlerweile ist jedoch die Version 2 des kostenfreien Textverarbeitungsprogramms OpenOffice erschienen – und dieses Produkt scheint den Adobe-Programmen hinsichtlich der Fähigkeit, barrierefreie PDF-Dateien zu erzeugen, ernsthafte Konkurrenz machen zu können. In der Zeit vor OpenOffice 2 war es aber kein Wunder, wenn Autoren immer wieder auf schlechtere, dafür aber kostenlose PDF-Erstellungsmethoden zurück griffen."
"Bei so vielen verschiedenen PDF-Versionen stellt sich mir natürlich sofort die Frage: Sind die denn untereinander kompatibel?"
"PDF ist aufwärts-, aber leider nicht zwingend abwärtskompatibel. Jede neuere Version des Adobe Readers kann Dokumente aus älteren PDF-Versionen anzeigen. Jede neue Version der Acrobat-Produkte ist auch in der Lage, Dokumente in älteren Versionen zu erzeugen. Umgekehrt ist eine fehlende Abwärtskompatibilität natürlich vor allem in den für uns Screenreader-Benutzer sensiblen Bereichen der Tags und der Lesbarkeit von geschützten PDF-Dokumenten sehr ärgerlich. Es kann leider passieren, dass ein Dokument, welches mit einem Acrobat-Produkt der Version 6 mit Tags versehen wurde, mit der Version 5 des Acrobat Readers nicht richtig angezeigt wird, da die Tags nicht ordnungsgemäß erkannt werden. Leider ist bezogen auf Tags in der Praxis auch fehlende Aufwärtskompatibilität beobachtet worden: Ein mittels A.A.5 'getaggtes' Dokument ließ sich mit dem A.R.7 nicht mehr ordnungsgemäß anzeigen. Ein mit 128-Bit stark verschlüsseltes PDF-Dokument kann mit A.R.-Versionen kleiner als fünf gar nicht geöffnet werden. Auf Dokumentverschlüsselung und Sicherheitseinstellungen kommen wir in Abschnitt 6.2 Verschlüsselt und versiegelt? — Die PDF-Sicherheitseinstellungen zu sprechen.
Die ständige Fortentwicklung des PDF hat natürlich zur Folge, dass Umwandlungsprogramme wie PDFToText, GhostScript oder GSView zwangsläufig hinterher hinken und – wie dies augenblicklich bei PDFToText der Fall ist – nur die zweitaktuellste PDF-Version unterstützen."
Der Beitrag Lesen, was drinsteht — rausholen, was drinsteckt: Wie blinde Computernutzer sich PDF-Dokumente zugänglich machen besteht aus folgenden einzelnen Webseiten: Besonders die schlechte Aufbereitung von PDF-Dokumenten verstellt blinden Nutzern oft die selbständige Verwendung der Dokumente. Neben dem Adobe Reader bietet weitere Software die Möglichkeit für Screenreadernutzer, auf den Inhalt von PDF-Dokumenten zuzugreifen. Was blinde und sehbehinderte Nutzer bei der Installation des Adobe Readers beachten müssen. Beschreibung des Installationsvorgangs und der zu beachtenden Einstellungen, damit das Lesen von PDF-Dokumenten optimal gelingt. Installation von XPDF bzw. PDFToText mit Hinweisen für blinde und sehbehinderte Nutzer. GSView und Ghostscript sind für Screenreadernutzer zusätzlich erforderlich zum Adobe Reader, wenn sie PDF-Dokumente mit Sicherheitseinstellungen lesen wollen. Hier finden Sie eine Anleitung zur Installation dieser Software mit Hinweisen zur Bedienung in einem Screenreader. Zum Lesen von PDF-Dokumenten in einer Sprachausgabe ist die Installation einer OCR-Software für viele Fälle sinnvoll. Installation und Hinweise zu Einstellungen werden hier beschrieben für Omnipage Pro 14. Ein Entscheidungsschema für blinde Nutzer, wann sie welches Programm zum Lesen von PDF-Dokumenten einsetzen sollen. Diese umfassen vor allem den Adobe Reader, OCR-Programmen PDFToText (XPDF) und GSView (Ghostscript). Einführung in die Nutzung des Adobe Readers zum Lesen von PDF in Screenreadern. Wie ein Screenreader mit dem Adobe Reader über MSAA und andere Methoden arbeitet. Die Bedienung des Adobe Readers mit der Tastatur ist für Screenreadernutzer wichtig. Das Einscannen von Formularen und die Bereitstellung als PDF reicht nicht aus, um die Zugänglichkeit der Formulare herzustellen. Screenreader benötigen die Auszeichnung mit Tags sowie weitere MSAA-Informationen. Die Verwendung der Adobe Reader-Sprachausgabe zum Vorlesen von PDF-Dokumenten und -Formularen erfordert eine SAPI-kompatible Sprachausgabe. Einige Einstellungen sollten im Adobe Reader vorgenommen werden, wenn Screenreader auf PDF-Dokumente besser zugreifen können sollen. Es gibt verschiedene Möglichkeiten, aus PDF Textdateien zu erstellen. Extrahieren von Text aus einer PDF unter Verwendung eines Screenreaders. Umwandlung von PDF nach Text mit PDFToText: Was Screenreadernutzer beachten müssen. Umwandeln von PDF nach Text mit GSView. Die Verwendung von PDF in Screenreadern ist oft problematisch. Diese Seite beschreibt, wie blinde Nutzer PDF-Dokumente mit einer OCR-Software (Omnipage Pro 12 und 14, An Open Book 6 und 7) in ein zugängliches Format wie Microsoft Word umwandeln können. Umwandlung einer PDF in eine Screenreader-fähigen Datei über einen kostenlosen Web-Service. Hintergrundwissen zu Tagged PDF oder Verschlüsselungsmöglichkeiten kann Screenreadernutzern bei der Interpretation von Fehlermeldungen hilfreich sein. (Aktuelle Seite) Bei der Verschlüsselung von PDF-Dokumenten ist die richtige Vorgehensweise besonders wichtig, um die Zugänglichkeit für Screenreadernutzer zu gewährleisten. Tags sind beim Lesen und beim Export in andere Formate notwendig, damit Screenreadernutzer die Struktur der Inhalte nachvollziehen können. "Viele Wege führen nach Rom" — aber nur die richtige Technik im PDF-Erstellungsprozess führt zu zugänglichen Dokumenten. Blinde Nutzer sind bei der Verwendung von PDF-Dokumenten immer noch stark benachteiligt. Hersteller und Autoren könnten diese Situation verbessern. Einige Artikel/Bücher und Online-Ressourcen zur Barrierefreiheit von PDF. Einige Angaben zu Oliver Nadig. Die folgenden Begriffe dieser Seite werden auch im Glossar definiert:
Blättern zur nächsten oder vorherigen Seite