Wie sich blinde Computernutzer PDF-Dokumente zugänglich machen geschrieben von Oliver Nadig (2005)

Dieser Beitrag wurde von Oliver Nadig in Oktober 2005 verfasst. Die vorliegende Fassung ist die Version 1.02 vom 25.1.2006.

1. Klagelied eines frustrierten PDF-Neulings

"Wer hat bloß dieses PDF erfunden", fragt – nein seufzt der blinde Herr in mittleren Jahren, der mir in meiner EDV-Sprechstunde für blinde und sehbehinderte Computernutzer gegenübersitzt.

"Das PDF (die Abkürzung steht übrigens für Portable Document Format) wurde im Jahre 1993 von der Firma Adobe Systems Incorporated erfunden", könnte ich meinem Gesprächspartner antworten, aber das würde seine Probleme, die er mir bereits geschildert hat, nicht lösen.

Mein Besucher ist seit einigen Wochen stolzer Besitzer eines blindengerecht ausgerüsteten Computerarbeitsplatzes. Das bedeutet zunächst einmal, dass auf seinem Schreibtisch ein handelsüblicher Computer mit Monitor und einem Paar Lautsprecherboxen steht. Neben dem Betriebssystem Windows XP, der Textverarbeitung Microsoft Word und einigen weiteren Anwendungsprogrammen, ist auf der Festplatte des Computers noch eine für meinen Besucher absolut notwendige Software installiert, nämlich ein sogenanntes Bildschirmausleseprogramm (auch Screenreader genannt).

Da mein Gast als blinder Computernutzer den Bildschirminhalt optisch nicht wahrnehmen kann, sorgt der Screenreader dafür, dass die Informationen, die auf dem Computermonitor zu sehen sind, aufbereitet und über eine Sprachausgabe und eine sogenannte Braillezeile wiedergegeben werden. Die Sprachausgabe ist eine – meist bereits in den Screenreader integrierte – Software. Ihre meist gut verständliche und zuweilen recht angenehme Stimme wird über die Lautsprecher des Computers ausgegeben.

Die Braillezeile ist ein meist platzsparend unter der PC-Tastatur stehendes, flaches, elektronisch gesteuertes Ausgabegerät, das mit Hilfe einer Vielzahl von Stiften Blindenschriftbuchstaben formt, die mit den Fingern ertastet werden. Da die Stifte bei Bedarf jederzeit entweder unter der Oberfläche verschwinden oder wieder daraus hervorgeschoben werden können, lässt sich dort, wo eben noch ein alter Buchstabe zu fühlen war, ein neuer Formen, wenn sich beispielsweise der Bildschirminhalt ändert.

Je nach Breite der Braillezeile können dort gleichzeitig zwischen 20 und 80 Zeichen abgebildet werden – in jedem Falle aber maximal eine Bildschirmzeile, wovon das Gerät seinen Namen erhalten hat.

Zusätzlich hat sich mein blinder Gesprächspartner auch einen Scanner angeschafft. Sein Besitzer kann sich damit unter Verwendung einer Texterkennungssoftware Briefe, Bücher, Zeitschriften und sonstige gedruckte Schriftstücke aller Art zugänglich machen. Dazu erstellt der Scanner zunächst ein Bild von der Textseite, die auf seine Glasplatte gelegt wurde und überträgt es an den Computer. Dort kümmert sich dann die Texterkennungssoftware darum, dass die auf dem Seitenabbild sichtbare Schrift in ein Textdokument verwandelt wird. Dieser elektronische Text wird dann mit Hilfe des Screenreaders über die Sprachausgabe und die Braillezeile wiedergegeben.

Nun hat sich mein Besucher also mit seinen Geräten angefreundet, hat unter Verwendung seines Scanners schon so manchen Text gelesen, hat in Word schon so manchen Brief an Bekannte geschrieben, ist sogar ins Internet vorgedrungen und hat dort – oh Schreck – Bekanntschaft mit PDF-Dokumenten gemacht.

"Zusatzinformationen zur letzten Wissenschaftssendung auf meinem Lieblingsradiosender, eine Broschüre über die Rentenreform, die Bedienungsanleitung zu meinem Fernseher, deren Original ich letztes Jahr irgendwie verlegt habe – sogar die Abwassergebührenordnung meiner Heimatgemeinde – alles habe ich im Internet gefunden, aber immer nur als PDF-Datei!"

"Welche Probleme gab es denn beim Lesen dieser Dokumente", frage ich und ahne schon, was da kommen würde.

"Eine ganze Menge – und jedes Mal was Anderes!", kam prompt die erwartete Antwort.

"Es fängt schon damit an, dass sich die PDF-Dateien im Internet immer automatisch öffnen, was ich gar nicht will. Manchmal kann ich nur die erste Seite der PDF-Datei lesen – ab und zu noch nicht mal die! In der Rentenbroschüre waren alle Sätze und Absätze durcheinander. Bei der Abwassergebührenordnung und bei der Bedienungsanleitung zu meinem Fernseher kamen sogar Fehlermeldungen. Beim Abwassertext hat meine Sprachausgabe irgendwas davon erzählt, dass das Dokument leer zu sein scheint – das kann doch aber wohl nicht ganz stimmen. Bei der Bedienungsanleitung wurde etwas von Sicherheitseinstellungen geplappert, die angeblich das Lesen des Dokuments verhindern würden. Ein verflixter Kram ist das mit dem PDF!"

Mir wird sofort klar, dass ich ganz am Anfang beginnen muss, wenn ich dem verzweifelten Herrn helfen möchte, seine PDF-Dokumente so weit wie möglich in den Griff zu bekommen. Also fange ich mit einer oft geprobten Vorrede an:

"Da haben wir ja gleich einen ganzen Sack voller Ärgernisse. Alle Probleme, die Sie schildern, habe ich entweder selbst schon beim Umgang mit PDF-Dateien gehabt oder ich kenne andere blinde Computernutzer, die über diese Schwierigkeiten und Fehlermeldungen berichtet haben. Wenn Ihnen bei Ihrem Kampf mit den PDF-Dateien allerdings eine sehende Person über die Schulter geschaut hätte, wäre sie etwas verwundert über Ihre Schwierigkeiten gewesen, denn am Bildschirm war mit Sicherheit in jedem Fall ein optisch ansprechender Text zu sehen."

"Das glaube ich Ihnen ja aufs Wort. Aber wie kann es denn sein, dass wir Benutzer eines Screenreaders so viele Probleme mit etwas haben, das für Sehende die einfachste Sache der Welt zu sein scheint?"

"Das liegt meistens in der Natur der PDF-Dokumente selbst und sehr viel seltener daran, dass unsere Bildschirmausleseprogramme Mängel aufweisen."

"Muss ja eine sehr vielseitige Natur sein, wenn es bei einigen PDF-Dokumenten fast gar keine Probleme gibt und mit Anderen scheinbar überhaupt nicht geht."

"Mit dem Stichwort 'Vielfalt' haben Sie in der Tat den Nagel auf den Kopf getroffen. Man kann nämlich buchstäblich auf tausend Wegen zu einer PDF-Datei gelangen."

"Tatsächlich? Ich hatte mir das so ähnlich wie bei der Textverarbeitung in Microsoft Word vorgestellt. Da habe ich doch ein einziges Programm, mit dem ich Dateien erstelle, die dann die Endung '.doc' bekommen und die dann als Word-Dokumente bezeichnet werden."

"Bei PDF-Dateien ist das ein wenig anders. Es gibt zwar Programme, in denen Sie ein Dokument erstellen und dann direkt als PDF-Datei abspeichern können. Das bekannteste und am besten dafür geeignete Programm stammt von den Erfindern der PDF-Dokumente selbst, also von der Firma Adobe Systems und heißt Adobe Acrobat. Das gibt es jetzt aktuell schon in der Version 7."

"Mein Computer öffnet PDF-Dokumente immer mit einem Programm namens Adobe Reader, Version 6.02. Bedeuten Adobe Acrobat und Adobe Reader das gleiche?"

"Nein, aber aufgrund der Namensähnlichkeit sind Verwechslungen nur all zu verständlich! Hinzu kommt noch, dass das Programm erst seit der Version 6.0 Adobe Reader heißt, bis zur Version 5.1 aber auf den Namen Adobe Acrobat Reader hörte.

Der Adobe Reader ist ein kostenloses Programm, mit dem Sie PDF-Dokumente zwar lesen, aber nicht selbst erstellen können. Sie bekommen den Adobe Reader über das Internet, er ist aber auch auf vielen Programm-CDs enthalten, weil mittlerweile zahlreiche Software-Handbücher als PDF-Datei zur Verfügung gestellt werden. Der Adobe Reader ist das einzige PDF-Anzeigeprogramm, das mit Screenreadern direkt zusammen arbeitet. Versuchen Sie also nicht, sich mit Hilfe anderer Software PDF-Dokumente vorlesen zu lassen – der Versuch ist zum Scheitern verurteilt. Vergessen Sie nie, dass der Adobe Reader kein Textverarbeitungsprogramm, sondern nur ein Betrachter, ein sogenannter Viewer ist."

"Dann vermute ich mal, dass die Software namens Adobe Acrobat, mit der man PDF-Dokumente nicht nur anschauen, sondern auch erstellen kann, eine Kleinigkeit kostet."

"Ja, und das nicht zu knapp! Das Produkt Adobe Acrobat gibt es einmal in der Standard-Version, die aber schon über 400 Euro kostet. Die Professional Edition kostet sogar über 600 Euro. Die Finanzen sind übrigens der Knackpunkt: Mit Hilfe von Adobe Acrobat lassen sich zwar hervorragend zugängliche PDF-Dokumente erstellen; da die Software aber so teuer ist, wird sie nur von wenigen PDF-Autoren eingesetzt, die lieber auf kostengünstigere oder kostenlose Möglichkeiten zur PDF-Erstellung zurück greifen. Leider liefern die kostengünstigen und kostenlosen Programme aber im Durchschnitt sehr viel schlechter zugängliches PDF."

"Dann habe ich wohl schon mit ein paar schlecht zugänglichen PDF-Dateien Bekanntschaft gemacht. Bestimmt haben wir im Laufe unseres Gespräches noch Gelegenheit zu besprechen, auf welchen unterschiedlichen Wegen PDF-Dateien erzeugt werden können und mit welchen Programmen man die am besten für Screenreader geeigneten Dokumente produziert. Für den Augenblick interessiert mich aber mehr, wie ich diese Dateien vernünftig lesen kann. Gut: Es gibt viele Erstellungsmöglichkeiten für PDF-Dateien, Aber ich selbst benutze doch immer denselben Screenreader und immer den selben Viewer, nämlich den Adobe Reader 6.02. Wodurch unterscheiden sich denn nun genau die für mich gut zugänglichen – also gut lesbaren –  PDF-Dokumente von den schlecht zugänglichen?"

"Zunächst müssen wir uns darüber klar werden, dass das PDF ein Schaukasten-Dokumentformat ist. Ich meine damit Folgendes: PDF ist so beschaffen, dass die entsprechenden Dokumente auf allen Betriebssystemen und in allen Anzeigeprogrammen stets gleich aussehen, und zwar so, wie es der Autor wünscht. Dazu bettet er einfach die Informationen über das optische Erscheinungsbild, die verwendeten Schriftarten, die benötigten Bilder und vieles mehr in sein Dokument ein. PDF ist nahezu ein Allesfresser, wenn es um Schrift und Grafik geht. Diese erzwungene Unveränderbarkeit des Erscheinungsbildes kann im übertragenen Sinne so gedeutet werden, als würde jemand ein Dokument in eine Glasvitrine hängen, um es vor beabsichtigten oder unbeabsichtigten Veränderungen zu schützen. Dies steht natürlich im Widerspruch zu den Bedürfnissen blinder und sehbehinderter Computeranwender:

Denken Sie in diesem Zusammenhang nur einmal daran wie wichtig es für Sie als nicht-Sehenden bei einem Museumsbesuch ist, dass die Ausstellungsstücke aus ihren Vitrinen geholt werden, damit sie Sie betasten können."

"Das leuchtet mir ein: PDF-Dateien sind wie Ausstellungsgegenstände, die in Schaukästen oder hinter Absperrungen vor mir in Sicherheit gebracht wurden, und es scheint nicht eben einfach zu sein, eine Ausnahmegenehmigung zu erhalten, sie anfassen zu dürfen.

Worin liegen denn nun aber konkret die Barrieren, die potentiell zwischen mir und dem Inhalt meiner PDF-Dokumente liegen?"

"Es lassen sich die folgenden sieben Punkte benennen, in denen sich ein schlecht zugängliches von einem gut zugänglichen (barrierefreien) PDF-Dokument unterscheidet:

  1. Der Inhalt liegt nicht als Text, sondern als Grafik vor:
    Sie wissen, dass ein Screenreader nur mit solchen Informationen etwas anfangen kann, die als Text vorliegen; Grafiken kann ein Bildschirmleseprogramm dagegen nicht erkennen.

    Nun ist es technisch aber möglich, einen Text mit Hilfe eines Scanners elektronisch zu erfassen, ihn als reine Grafik zu speichern und daraus ein PDF-Dokument zu erstellen. Dieses kann Ihnen Ihr Screenreader aber nicht vorlesen, da es rein grafisch ist. Auch für sehende Benutzer haben grafische PDF-Dateien einen gravierenden Nachteil: Der Text kann zwar mit den Augen gelesen, aber nicht nach bestimmten Wörtern durchsucht werden, weil die Buchstaben ja keine echten Textzeichen, sondern Bestandteile eines Bildes sind.

    Für einen Screenreader jedenfalls ist ein grafisches Dokument leer und damit unzugänglich. Das dürfte auch auf die Abwassergebührenordnung zutreffen, von der Sie eingangs gesprochen haben. Barrierefreie PDF-Dokumente bestehen immer aus 'echtem' Text, also aus einer Menge 'echter' Zeichen, in denen nach Textpassagen gesucht werden kann. Grafische PDF-Dokumente können Sie sich nur mit Hilfe spezieller Texterkennungsprogramme zugänglich machen. Dies besprechen wir ausführlich in Intern: Abschnitt 5.4.

    Aber bereits die Autoren können grafische und damit unzugängliche PDF-Dokumente zugänglich machen, indem Sie ihre Dokumente nach dem Scannen per Texterkennung umwandeln lassen. Dies besprechen wir in Intern: Abschnitt 6.4.

  2. Fehlende Informationen über die logische Dokumentstruktur:
    Nehmen Sie einmal an, dass Sie mit Hilfe von Microsoft Word einen Brief an Ihre normalsichtige Tante Elvira schreiben.

    Indem Sie über die Tastatur die notwendigen Zeichen eintippen, erzeugen Sie den Inhalt des Briefes. Indem Sie Text einrücken, fett drucken, unterstreichen oder bestimmte Textteile in anderer Schriftart und Schriftgröße darstellen, geben Sie ihrem Brief seine äußere Form: Sein Layout. Wenn Tante Elvira den Brief mit den Augen überfliegt, kann sie anhand seines Layouts sofort erkennen, welcher Text welchen Sinn erfüllt. Beispielsweise kann sie sofort sehen, wo auf dem Papier sich Adressangaben, Anrede, Fließtext und Grußformel befinden. Das kann sie aber nur deshalb, weil sie über den allgemeinen Aufbau eines Briefes und seine Bestandteile Bescheid weiß.

    Tante Elvira kann also durch einen einzigen Blick auf den Brief seinen logischen Aufbau aus Adressblöcken, Anrede, Fließtext und Grußformel erkennen, ohne dass diese Informationen über die Dokumentstruktur in der Word-Datei enthalten sind. Wer nichts über den logischen Aufbau eines Briefes wüsste, der würde in ihrem Word-Dokument auch keine Hinweise darauf finden.

    Sie können gerne sagen, dass das bei einem Brief auch gar nicht so schlimm ist, aber stellen Sie sich statt des Briefes einen längeren Referatstext, eine Hausarbeit oder einen wissenschaftlichen Artikel vor. Derartige Dokumente sind normalerweise mit Hilfe verschiedener Überschriften-Ebenen hierarchisch gegliedert und enthalten nummerierte Listen, Aufzählungen, Fußnoten, Tabellen und vieles mehr."

    "Solche Artikel kenne ich aus dem Internet. Da werden mir aber die Überschriften, Nummerierungen, Listen und Tabellen immer brav von meinem Screenreader vorgelesen."

    "So ist es. Das liegt daran, dass in diesen Texten neben dem reinen Inhalt und den Informationen über das Layout auch Angaben über die logische Dokumentstruktur enthalten sind. Diese Angaben werden in Form von Markierungen in die Dokumente eingebettet und im Fachjargon als Tags bezeichnet. In den Internet-Dokumenten sind also nicht nur Informationen zum optischen Erscheinungsbild hinterlegt sondern auch Tags, die beispielsweise sagen: 'Dies hier ist eine Überschrift' oder 'das hier ist ein Fließtextabsatz' oder 'jetzt kommt eine Tabelle mit drei Spalten und fünf Reihen'. Ihr Screenreader wertet diese Tags aus und liest Ihnen den Text entsprechend strukturiert vor."

    "Ich glaube, ich verstehe: Wenn ich mit meinem Screenreader ein Dokument lese, dem diese strukturierenden Tags fehlen, kann zwar vielleicht der Sehende anhand des Layouts erkennen, ob ein bestimmter Textteil eine Überschrift, eine Aufzählung oder eine Tabellenzelle sein soll, aber mein Screenreader kann das nicht, weil er kein intuitives Wissen über die Regeln der Textgestaltung hat."

    "Vollkommen korrekt. Gut zugängliche PDF-Dokumente enthalten Tags, die dem Screenreader erstens die logische Dokumentstruktur mitteilen und zweitens Auskunft darüber geben, in welcher Reihenfolge die verschiedenen Textblöcke auf den jeweiligen Text-Seiten vorgelesen werden müssen.

    Die Anwesenheit von Tags wirkt sich aber nicht nur positiv auf das Vorlesen durch eine Sprachausgabe, sondern auch auf die Qualität von Dateien aus, die durch die Umwandlung von PDF-Dokumenten in ein anderes Dokumentformat entstehen. Schlecht zugängliche PDF-Dateien sehen zwar am Bildschirm schön aus, sind aber inhaltlich nicht strukturiert, weil sie keine Tags enthalten. Sie haben keine Chance, sich absatz- oder überschriftenweise in einem solchen Dokument zu bewegen. Die Texte werden ohne logische Gliederung 'in einem Rutsch' vorgelesen.

    Was aber noch viel schlimmer ist: Die Reihenfolge, in der die Textteile vorgelesen werden müssen, stimmt unter Umständen nicht mehr. Bei Texten, deren Seiten mehrere Textspalten aufweisen, wobei die Spalten womöglich noch durch Bilder und über die ganze Seitenbreite verlaufende Überschriften unterbrochen werden, werden Absätze durcheinander gewürfelt, Textpassagen in falscher Reihenfolge vorgelesen und es werden Tabellen 'zerpflückt'. Das trifft vermutlich auf die Rentenbroschüre zu, von der Sie gesprochen haben."

    "Aha, dann ist das also vergleichbar mit der Situation, die ich manchmal beim einscannen von mehrspaltigen Zeitschriften- und Zeitungsseiten habe: Da wird mir der Text einer Seite ab und zu auch in verkehrter Reihenfolge vorgelesen oder es werden Tabellen 'zerrissen."

    "Genau richtig! Während ein normalsichtiger Mensch ohne Mühe die Lesereihenfolge (Lesefolge) der verschiedenen Textblöcke auf einer Seite bestimmen kann, versagen Texterkennungsprogramme und Screenreader beim Entziffern mehrspaltiger Textseiten hin und wieder."

    "Beim Einscannen mehrspaltiger Seiten kann ich die Probleme ja notfalls dadurch lösen, dass ich das Blatt von einem Sehenden entsprechend zerschneiden lasse. Gibt es denn für mehrspaltige PDF-Dokumente auch eine Lösung?"

    "Zumindest gibt es Lösungsversuche. Die bespreche ich mit Ihnen, wenn wir uns in Intern: Teil vier im Intern: Abschnitt 4.2 ausführlich mit dem Adobe Reader beschäftigen. Außerdem vertiefen wir das Thema 'Tags' aus einer eher theoretischen Sicht in Intern: Abschnitt 6.3.

    Kommen wir aber zunächst einmal zum dritten der sechs Probleme im Zusammenhang mit schlecht zugänglichen PDF-Dokumenten.

  3. Zugriffsfeindlicher Dokumentschutz:
    Wie bereits erwähnt, kann der Autor den Inhalt seines PDF-Dokumentes schützen. Obwohl man es auf dem Bildschirm sehen und sich darin bewegen kann, lässt sich mit Hilfe der PDF-Sicherheitsmechanismen insbesondere das Ausdrucken und das Kopieren von Dokumentinhalten in die Zwischenablage verbieten.

    Der Autor kann beim Schützen eines Dokumentes so ungeschickt vorgehen, dass dem Screenreader der Zugriff auf sämtlichen Dokumentinhalt ebenfalls verweigert wird. In diesem Fall kann das Dokument zwar von sehenden Personen mit den Augen, nicht aber von einem blinden Computeranwender mittels Screenreader gelesen werden. In diesem Fall kann man versuchen, den Text des Dokumentes mit Hilfe von Programmen zu extrahieren, die die Sicherheitsmechanismen ignorieren. Wir besprechen die Handhabung derartiger Software in Intern: Abschnitt 5.3.

    Zugängliche PDF-Dokumente verwenden Schutzmechanismen, die den Zugriff des Screenreaders auf den Dokumentinhalt nicht verhindern und damit sowohl dem Schutzbedürfnis des Autors als auch dem Informationsbedürfnis des Screenreader-Nutzers Rechnung tragen. Nähere Informationen zu diesem Thema erhalten Sie in Intern: Abschnitt 6.2.

    Nun zum vierten Problem …

  4. Fehlende Navigationsmöglichkeiten:
    In längeren Texten will man sich nicht nur zeilen- und seitenweise bewegen können; von Dokumenten in modernen Dateiformaten wie HTML (Internetseiten) oder DOC (Microsoft Word) erwarten wir, dass uns interne Querverweise (Links) zur Verfügung stehen. Beispielsweise sollte es ein Inhaltsverzeichnis geben, dessen Einträge Querverweise zu den einzelnen Dokumentabschnitten darstellen. Auch im Text erwarten wir immer wieder Links zu anderen Textstellen, wenn darauf verwiesen wird. Mit anderen Worten: In einem komplexeren Dokument sollte man sich nicht nur auf physischer Ebene zeilen- und seitenweise, sondern auch auf logischer Ebene kapitel- und abschnittsweise bewegen können.

    Dies ist auch in gut strukturierten PDF-Dokumenten mit Hilfe von Querverweisen möglich. Schlecht zugängliche PDF-Dokumente wurden ohne Querverweise erstellt. Wie Sie PDF-Querverweise beim Lesen im Adobe Reader benutzen, erfahren Sie in Intern: Abschnitt 4.2.

    Nun zum fünften Problem ...

  5. Fehlende Umflusskontrolle bei Textvergrößerung:
    Sehbehinderte Computerbenutzer verwenden neben spezieller Vergrößerungssoftware oftmals auch die vom jeweiligen Programm selbst zur Verfügung gestellten Zoom-Funktionen. Dabei vergrößert sich natürlich nur die Schrift, während der verfügbare Platz im Programmfenster gleich bleibt.

    Um den gesamten Inhalt zu lesen, muss das Dokument unter Umständen im Fenster horizontal gescrollt werden. In einer solchen Situation wünschen sich Sehbehinderte ein Dokument, das unabhängig von der eingestellten Vergrößerungsstufe stets komplett im Fenster sichtbar bleibt. Dies kann nur so realisiert werden, dass sich Zeilenumbrüche, Textspalten und Tabellen automatisch und intelligent umorganisieren. Die Anordnung von Textblöcken wird dabei also je nach Textvergrößerung sinnvoll verändert. Diesen Vorgang nennt man 'umfließen'.

    Für Sehbehinderte schlecht zugängliche PDF-Dokumente enthalten keinerlei Informationen darüber, wie sich ihr Inhalt bei veränderter Darstellungsgröße am Bildschirm dynamisch umordnen muss, sie haben ein schlechtes Umfließverhalten. Gut zugängliche PDF-Dateien umfließen automatisch bei veränderter Dokumentanzeigegröße.

  6. Darstellungsprobleme bei selbst gewähltem Farbschema im Zusammenhang mit farbigen Texthinterlegungen:
    Diese für sehbehinderte Computeranwender relevante Problematik wird sehr anschaulich auf den Seiten des Projektes "BIK - barrierefrei informieren und kommunizieren" (kurz: BIK) dargestellt, weshalb ich hier daraus zitieren möchte:

    … So bietet der Adobe Reader zwar die für viele sehbehinderte Benutzer wichtige Möglichkeit, die Farben von PDFs anzupassen. Die Benutzereinstellungen beeinflussen jedoch nur den Seitenhintergrund und die Textfarbe – nicht aber Hintergrundflächen wie zum Beispiel farbig (oder auch weiß) hinterlegte Spalten oder Textkästen. Dadurch kann Text unter Umständen unlesbar werden, weil Schrift und Hintergrund in der gleichen Farbe angezeigt werden.
    Ein Beispiel: Bei einem Textkasten mit gelbem Hintergrund und schwarzer Schrift führt die Einstellung "Gelber Text auf schwarz" zu unsichtbarer Schrift, denn nur der Seitenhintergrund wird schwarz, der Kasten bleibt jedoch Gelb. Das Ergebnis: gelbe Schrift auf gelbem Hintergrund.

    Für die genannte Problematik ist nicht der PDF-Autor, sondern ein Fehler in der Adobe-Software verantwortlich. Einstweilen empfiehlt es sich, keine farbigen Hintergründe und Texthinterlegungen zu verwenden.

  7. Schlechte Zeichencodierung:
    Während sehende Computerbenutzer Schriftzeichen an ihrem optischen Erscheinungsbild erkennen, identifizieren Screenreader Buchstaben, Ziffern und Sonderzeichen anhand einer festgelegten Zahl. Dabei muss jedem Buchstaben eindeutig genau eine Zahl und jeder Zahl eindeutig genau ein Buchstabe zugeordnet sein. Vielleicht wissen Sie, dass es in der Schrift der Sehenden üblich ist, bestimmte Buchstaben dann näher aneinander zu rücken, wenn sie in bestimmten Kombinationen vorkommen. Das ist zum Beispiel der Fall, wenn ein großes 'T' und ein kleines 'e' oder zwei kleine 'f' aufeinander folgen. Diese Buchstaben-Aneinanderrückungen werden als Unterschneidungen und als Ligaturen bezeichnet.

    Manche Zeichensätze verwenden für Ligaturen und Unterschneidungen eigene Zahlenbezeichnungen, die aber nicht eindeutig sind. Die Folge: Muss ein Screenreader einen Text mit Ligaturen und Unterschneidungen vorlesen, der unter Verwendung eines derartig ungünstigen Zeichensatzes codiert wurde, spricht er für jede Ligatur und jede Unterschneidung unverständlichen 'Buchstabensalat'.

    Gut zugängliche PDF-Dokumente verwenden Zeichensätze, die Ligaturen und Unterschneidungen entweder gar nicht separat codieren oder die ihnen zumindest eindeutige zahlen zuordnen, so dass der Text von einem Screenreader problemlos erkannt wird. Auch beim Umwandeln von PDF in ein anderes Dokumentenformat gibt es dann keine Schwierigkeiten."

"Sie haben einzelne Abschnitte des vor uns liegenden Gespräches erwähnt. Wie sieht denn die grobe Gliederung Ihrer Beratung insgesamt aus?"

"Sie haben schon gemerkt, dass Sie nicht mit einem einzigen Programm auskommen, wenn Sie sich insbesondere auch problematische, also unzugängliche, PDF-Dateien erschließen müssen. Welche Software Sie installieren sollten, wo Sie sie erhalten und wie die Installation und die Konfiguration der Programme vor sich geht, besprechen wir zunächst im folgenden Intern: Teil 2.

Faustregeln dafür, unter welchen Umständen bzw. bei welchen Problemen Sie welches Programm auf eine bestimmte PDF-Datei loslassen, diskutieren wir in Intern: Teil 3.

In Intern: Teil 5 reden wir dann darüber, wie diese Programme bedient werden, nachdem wir uns in Intern: Teil 4 den Geheimnissen des Adobe Readers gewidmet haben.

In Intern: Teil 6 möchte ich Ihnen noch ein wenig mehr Hintergrundwissen über PDF im Allgemeinen geben, weil Sie danach gefragt haben. Wir werden daraus auch ein paar Kriterien für zugängliche PDF- Dokumente ableiten, die Sie als konkrete Tipps an PDF-Autoren weiter geben können.

Abschließend ziehen wir in Intern: Teil 7 Bilanz – und ich nenne Ihnen ganz zum Schluss Intern: weiterführende Literatur, falls Sie das heute erworbene Wissen vertiefen möchten."

"Da haben wir ja noch eine Menge vor uns. Vieles habe ich aber auch schon in der Einleitung unseres Gespräches gelernt. Lassen Sie es mich noch einmal kurz zusammenfassen ..."

Zusammenfassung von Teil 1

  1. "PDF ist die Abkürzung für Portable Document Format und bezeichnet ein von der Firma Adobe Systems entwickeltes Dokumentenformat. Es handelt sich um ein 'Schaukasten-Format', weil das optische Erscheinungsbild der Dokumente im Mittelpunkt steht.
  2. Die für uns blinde und sehbehinderte Computernutzer barrierefreien (also gut zugänglichen) PDF-Dokumente unterscheiden sich in bis zu sieben Eigenschaften von den schlecht Zugänglichen – sie enthalten:
    1. Text, der nicht als Grafik, sondern als Buchstabenfolge abgespeichert und damit durchsuchbar ist;
    2. Informationen über den logischen Dokumentaufbau, sogenannte Tags, die es dem Screenreader ermöglichen, auch komplex gestaltete PDF-Texte strukturiert und in richtiger Lesefolge wieder zu geben;
    3. Schutzmechanismen, die nicht auch gleichzeitig dem Screenreader den Zugriff auf das Dokument verwehren;
    4. Navigationsmöglichkeiten in Form von Querverweisen, die das kapitel- und abschnittsweise Bewegen im Dokument unterstützen;
    5. Informationen, die das automatische Umfließen eines Dokumentes beim Schriftvergrößern unterstützen;
    6. möglichst keine farbigen Hintergründe und Texthinterlegungen, damit durch einen generellen Fehler in den Software-Produkten von Adobe Text bei Verwendung eines benutzerdefinierten Farbschemas nicht in der gleichen Farbe wie sein Hintergrund angezeigt wird und dadurch verschwindet;
    7. ausschließlich solche Zeichensätze, bei denen jedes Zeichen oder jede Zeichenkombination eindeutig einer festen Zahl zugeordnet ist.
  3. Zum direkten Lesen von PDF-Dokumenten mit einem Screenreader kommt als einziges Betrachtungsprogramm (als sogenannter Viewer) der Adobe Reader in Frage, der von der Firma Adobe Systems kostenlos zur Verfügung gestellt wird.
  4. In einigen Fällen kann es günstig sein, die PDF-Datei in ein zugänglicheres Dokumentenformat wie 'nur Text', 'Word' oder 'RTF' um zu wandeln. Hierzu stehen neben dem Adobe Reader einige weitere Programme zur Verfügung.
  5. Den Inhalt von PDF-Dokumenten, die aus reiner Grafik bestehen kann man sich nur unter Einsatz einer Texterkennungssoftware zugänglich machen."

"Das haben Sie so gut zusammen gefasst, das wir gleich zum nächsten Abschnitt übergehen können.

Ich möchte übrigens im Folgenden zwei Kürzungen im Zusammenhang mit den häufig vorkommenden Bezeichnungen 'Adobe Reader' bzw. 'Acrobat Reader' verwenden:

  1. Wenn ich von 'A.R.' spreche, meine ich eine beliebige Version des Adobe Readers oder des Acrobat Readers.
  2. Setze ich noch eine Zahl hinter 'A.R.', so meine ich eine ganz bestimmte Version oder Generation des Adobe Readers bzw. Acrobat Readers. Das Kürzel 'A.R.7' bezeichnet die aktuelle Programmversion 7; die Abkürzung 'A.R.5' soll für 'Acrobat Reader, Version 5' stehen."