Lesen, was drinsteht — rausholen, was drinsteckt: Wie blinde Computernutzer sich PDF-Dokumente zugänglich machen geschrieben von Oliver Nadig (2005)
Dieser Beitrag wurde von Oliver Nadig in Oktober 2005 verfasst. Die vorliegende Fassung ist die Version 1.02 vom 25.1.2006.
6.4 Zur fertigen PDF-Datei auf tausend (Irr)wegen
"Ich erwähnte bereits in Abschnitt 1 die folgenden Tatsachen:
- PDF-Dokumente werden meist ursprünglich in anderen Programmen erstellt und nachträglich in PDF umgewandelt.
- Es gibt sehr viele verschiedene Wege, aus einem Ursprungsdokument ein PDF-Dokument zu machen.
- Diese Wege unterscheiden sich aus unserer Sicht vor allem dadurch, dass auf den meisten davon unzugängliches PDF und nur auf wenigen zugängliches PDF entsteht."
"Richtig: Sie hatten mir sechs Merkmale genannt, in denen sich barrierefreie von unzugänglichen PDF-Dokumenten unterscheiden:
- Text, der in buchstaben- und nicht in Grafikform vorliegt,
- Vorhandensein von Tags,
- Vorhandensein einer Dokumentgliederung mittels Querverweisen,
- Sicherheitseinstellungen, die den Zugriff des Screenreaders auf Dokumentinhalte nicht verhindern,
- Vorhandensein eines korrekten Umfließverhaltens, wenn das Dokument vergrößert dargestellt wird und
- Verwendung unproblematischer Zeichensätze."
"Genau! In diesem Abschnitt möchte ich zwei Dinge tun:
- Im Unterabschnitt 6.4.1 möchte ich ein paar Worte darüber verlieren, auf welchen Wegen Autoren zu einem barrierefreien PDF-Dokument gelangen können, indem Sie für uns Screenreader-Benutzer ungünstige Wege der PDF-Erstellung vermeiden.
- Mit der Erzeugung eines PDF-Dokumentes ist es oft noch nicht getan. Im Unterabschnitt 6.4.2 gehe ich deshalb auf die Aspekte der Nachbearbeitung einer bestehenden PDF-Datei zur Optimierung der Zugänglichkeit ein."
6.4.1 Vom Autorenprogramm zur möglichst zugänglichen PDF-Datei
"Das Quelldokument, das später zu einer PDF-Datei gemacht wird, entsteht in einem Autorenprogramm. Als Autorenprogramm kommt heutzutage fast jede Software in Frage, weil es entsprechende Druckertreiber gibt, die PDF-Dateien erzeugen können. Wie diese Druckertreiber zu bewerten sind, stelle ich weiter unten ausführlich dar. Da sich aber einige Produkte mehr als andere als Autorenprogramm eignen, möchte ich die potentiellen Kandidaten in Gruppen einteilen:
- Textverarbeitungsprogramme wie Microsoft Word oder Corel Word Perfect,
- Tabellenkalkulationsprogramme wie Microsoft Excel oder Lotus 1-2-3,
- Präsentationsprogramme wie Microsoft PowerPoint,
- DTP-Programme. Dabei steht die Abkürzung 'DTP' für 'Desktop Publishing' und meint die Herstellung druckreifer Dokumente mit Hilfe von Computersoftware. Beispiele für DTP-Programme sind Adobe InDesign, Adobe PageMaker oder QuarkXPress,
- Grafikprogramme wie Adobe PhotoShop oder Corel Draw.
Die tausend Möglichkeiten, von einem Autorenprogramm zu einer PDF-Datei zu gelangen, lassen sich wie folgt einteilen:
- Einsatz eines PDF-Druckertreibers:
Das im Autorenprogramm erstellte Quelldokument wird mit Hilfe eines speziellen Druckertreibers direkt in PDF umgewandelt. Ein solcher Druckertreiber ist beispielsweise der in A.A. integrierte Treiber 'Adobe PDF'. Druckertreiber erzeugen in der Regel äußerst unzugängliche PDF-Dateien, da sie die im Quelldokument vorhandenen Strukturmerkmale nicht in Tags und die Gliederungsmerkmale nicht in Lesezeichen oder Querverweise verwandeln. - Einsatz eines sogenannten Distillers:
Distiller sind Programme, die PDF-Dokumente nicht direkt aus dem Format der Quelldatei, sondern aus einem 'Zwischenformat' erzeugen. Bei dem Zwischenformat handelt es sich um 'PostScript'. PostScript ist ein nicht für Bildschirme, sondern für Drucker gedachtes Dateiformat. PDF ist eine direkte Weiterentwicklung von PostScript. Distiller erstellen also zunächst eine – für den Benutzer meist unsichtbare – PostScript-Datei und daraus dann das PDF-Dokument. Indem der Distiller die PostScript-Datei mit sogenannten PDFMarks versieht, können Strukturmerkmale des Quelldokuments in 'getaggtes' PDF und Gliederungsmerkmale in Lesezeichen und Querverweise überführt werden. Werden Distiller also intelligent eingesetzt, lassen sich aus Quelldokumenten sehr zugängliche PDF-Dateien erstellen. Der am besten hierfür geeignete Distiller ist der Adobe Acrobat Distiller, der – wie der allerdings ungeeignete Druckertreiber 'Adobe PDF' zusammen mit dem A.A. ausgeliefert wird. Benutzern der Microsoft Office-Programme Word, Excel, PowerPoint und – ab A.A.7 auch Outlook – wird der Einsatz des Adobe Acrobat Distillers besonders schmackhaft gemacht: Zusammen mit A.A. installiert sich eine Makrosammlung namens PDFMaker in die vier genannten Office-Programme. Der PDFMaker bereichert die Office-Programme um eine neue Symbolleiste und ein zusätzliches Menü namens 'Adobe PDF'. Mit Hilfe dieser neuen Bedienelemente kann der Autor die zahlreichen Einstellungen des Adobe Acrobat Distillers bequem steuern und so ohne große Mühe unter Einsatz des PDFMakers seine Word, Excel- PowerPoint- und Outlook-Inhalte ohne viel Aufwand in barrierefreie PDF-Dokumente umwandeln. Dazu wird der Menüpunkt 'Adobe PDF | In Adobe PDF konvertieren' aus der entsprechenden Office-Anwendung heraus aufgerufen. Möchten Sie dieses Thema vertiefen, so beachten Sie die Literaturhinweise[4]und
[7]. Übrigens:
- Auch das Programm AFPL GhostScript ist ein Distiller, was schon die Namensähnlichkeit von 'GhostScript' und 'PostScript' nahe legt. Leider sind die mit Hilfe des kostenlosen AFPL GhostScript hergestellten PDF-Dateien nicht ganz so barrierefrei wie diejenigen des teuren PDFMakers.
- Arbeiten Sie nie direkt mit der Oberfläche des Adobe Acrobat Distillers! Nutzen Sie das Programm nur indirekt durch Verwendung von Makrosammlungen wie PDFMaker. Nur so werden dem Distiller automatisch die nötigen PDFMarks zugeleitet, aus denen die Tags und die Gliederung des entstehenden PDF-Dokumentes gebildet werden.
- Einsatz kostenloser Programme, die aber meist nichts Anderes darstellen als grafische Benutzeroberflächen für den Distiller GhostScript. Aus diesem Grund sind sie dem kostenpflichtigen Duo PDFMaker/Adobe Acrobat Distillers im Erzeugen barrierefreier PDF-Dokumente unterlegen. Ein Beispiel für eine derartige kostenlose Programmoberfläche ist 'WordToPDF'.
- Einsatz kostenloser Open Source-Textverarbeitungsprogramme wie OpenOffice ab Version 1.1.1. Das Programm unterstützt die direkte Erzeugung von PDF-Dateien aus OpenOffice-Quelldokumenten. Die Barrierefreiheit des von der Programmversion 1.1.1 gelieferten PDFs lässt leider noch einige Wünsche offen, dramatische Verbesserungen kündigen sich bereits für die Version 2 an.
- Einsatz kostenpflichtiger Programme, die sich als Konkurrenzprodukte zu A.A. verstehen, meist aber sehr viel preisgünstiger sind. Als Beispiele wären zu nennen:
- Der 'JAWS PDF Creator', der nicht mit dem Screenreader 'JAWS' zu verwechseln ist,
- 'PowerPDF',
- 'S.A.D.K. PDF Xchange Pro',
- 'PDF Machine',
- 'PDF Studio',
- 'PDF Genie'.
- DTP- und Grafikprogramme, die nicht aus dem Hause Adobe stammen:
Hier sind vor allem die Produkte 'QuarkXPress', Programme der Firma Macromedia sowie 'Corel Draw' zu nennen. Die PDF-Konvertierungsfunktionen dieser Produkte müssen aus der Sicht der Barrierefreiheit als nahezu unbrauchbar bezeichnet werden. - DTP- und Grafikprogramme aus dem Hause Adobe:
Obwohl sie stolze Preise haben, sind vor allem die DTP-Programme von Adobe Systems besonders gut zur Erstellung barrierefreier PDF-Dokumente geeignet. Hierbei sind zu nennen:- 'Adobe FrameMaker' oder 'Adobe PageMaker' ab Version 6.0 zur Erstellung von Textdokumenten,
- 'Adobe Designer', 'Adobe GoLive' oder 'Adobe LiveCycle Designer' zur Erstellung von Formularen und
- 'Adobe InDesign' ab Version 2.0 zur Erstellung von Broschüren.
Zusammenfassung von Unterabschnitt 6.4.1
- "Wer es sich finanziell leisten kann, sollte als Autorenprogramme für seine PDF-Dokumente unbedingt die Produkte des Microsoft Office-Paketes im Zusammenspiel mit dem PDFMaker einsetzen, der seinerseits Teil von A.A. ist. Dabei sollte man in jedem Fall die Professional-Edition von A.A. wählen, da nur sie im Gegensatz zur Standard-Version und zur Edition Adobe Acrobat Elements alle Werkzeuge zum Erstellen und Nachbearbeiten barrierefreier PDF-Dokumente enthält. der PDFMaker nutzt als PDF-Konvertierungsroutine den Acrobat Distiller. Dieses Programm-Duo erstellt sehr gut strukturierte und gegliederte PDF-Dokumente. Wem die Office-Programme nicht zusagen, der sollte mit einem DTP-Programm aus dem Hause Adobe arbeiten, und die damit erzeugten PDF-Dokumente anschließend mit A.A. nachbearbeiten.
- Für den schmalen Geldbeutel ist das Programm 'JAWS PDF Creator' zu empfehlen.
- Wer auf kostenlose Software angewiesen ist, sollte unbedingt mit AFPL GhostScript arbeiten. Für diesen Distiller gibt es kostenlose grafische Oberflächen.
- Alle anderen in diesem Unterabschnitt genannten Produkte sind unter dem Aspekt der Barrierefreiheit nicht – oder noch nicht – zu empfehlen."
6.4.2 PDF-Dokumente im Sinne der Barrierefreiheit nachbearbeiten
"Selbst die unter dem Aspekt der Zugänglichkeit am Besten geeigneten Autorenprogramme, erzeugen PDF-Dokumente, die in der Regel nachbearbeitet werden müssen. Autorenprogramme sind nämlich nicht perfekt darin, die logische Dokumentstruktur angemessen in einem Tag-Baum nach zu bilden. Zwei Grundsätze sollten beim Erstellen und Nachbearbeiten eines PDF-Dokumentes stets beachtet werden:
- Gliederung und Strukturierung sollten so weit wie möglich bereits im Quelldokument vorgenommen werden. Grund: Änderungen, die man nachträglich in der aus dem Quelldokument gewonnenen PDF-Datei vornimmt, lassen sich nicht ins Quelldokument rückübertragen. Wer beispielsweise die nach PDF gewandelte erste Version eines Quelldokumentes fünf Stunden lang nachbearbeitet und dann feststellt, dass im Quelldokument noch Änderungen vorgenommen werden müssen, darf mit der Nachbearbeitung von vorn beginnen.
- Zur Nachbearbeitung sollte unbedingt entweder A.A.6 oder A.A.7 benutzt werden.
Im Gegensatz zur Version 5 von Adobe Acrobat, bieten die Professional-Editionen der Sechser- und Siebenerversionen folgenden Vorteil: In A.A.5 mussten zwei wichtige Nachbearbeitungswerkzeuge nachträglich beschafft werden. Dabei handelte es sich:
- Um 'Make Accessible', ein Modul zur Zugänglichkeitsprüfung von PDF-Dokumenten im Sinne der Barrierefreiheit und
- um 'Paper Capture', ein Modul, das mit PDF-Dokumenten, die über einen Scanner erfasst wurden und als Grafik vorliegen, eine Texterkennung durchführt.
Bei einer vollständigen Installation von A.A.6 und A.A.7 sind die genannten Werkzeuge automatisch verfügbar. Im A.A.7 werden sie über folgende Menüpunkte aufgerufen:
- Die Zugänglichkeitsprüfung über 'Erweitert | Ausgabehilfe | Vollständige Prüfung',
- das Scannen inklusive Texterkennung mit 'Datei | PDF erstellen | Von Scanner' (danach im erscheinenden Dialog das Kontrollfeld 'Text mit OCR erkennen' aktivieren),
- die nachträgliche Texterkennung einer grafischen PDF-Datei über 'Dokument | Text mit OCR erkennen'.
Außerdem sind die 'Kinderkrankheiten' beim Setzen und Bearbeiten von Tags in den Versionen A.A.6 und A.A.7 weitgehend behoben.
Zur Erstellung barrierefreier Formulare wird nach wie vor ein Programm namens 'Adobe PDF Forms Access' empfohlen. Diese Software kann entweder als eigenständiges Produkt oder als Bestandteil des 'Adobe Acrobat Capture 3.0 Agent Pack' erworben werden."
"Wie geht man beim Nachbearbeiten grundsätzlich vor?"
"Folgende Schritte sind dazu erforderlich:
- Das aus der Quelldatei entstandene PDF-Dokument wird in A.A. geöffnet.
- In A.A.7 beispielsweise lässt man sich nun durch Einblenden der Navigationsregisterkarte 'Tags' den momentan existierenden Tag-Baum anzeigen.
- Mit Hilfe verschiedener Werkzeuge von A.A., auf die ich hier nicht näher eingehe, kann der Tag-Baum bearbeitet werden. Dies kann bedeuten, dass neue Tags oder sogar neue Tag-Baum-Ebenen angelegt, bestehende Tags in oder zwischen Tag-Baum-Ebenen verschoben oder sogar überflüssige Tags gelöscht werden.
- Die ausführliche Zugänglichkeitsprüfung hilft, vorhandene Unzulänglichkeiten zu erkennen. Als ultimatives Testkriterium sollten PDF-Autoren natürlich das Dokument bei ausgeschaltetem Bildschirm mit Hilfe eines Screenreaders zu lesen versuchen und nachprüfen, ob bei der Dokumentumwandlung ins Textformat alle Inhalte erhalten bleiben und in der richtigen Lesereihenfolge stehen.
Dies waren nur Grobinformationen. Details finden Sie in den unter Weiterführende Literaturhinweise aufgeführten Publikationen [1], [2], [3] und [4]."
Der Beitrag Besonders die schlechte Aufbereitung von PDF-Dokumenten verstellt blinden Nutzern oft die selbständige Verwendung der Dokumente. Neben dem Adobe Reader bietet weitere Software die Möglichkeit für Screenreadernutzer, auf den Inhalt von PDF-Dokumenten zuzugreifen. Was blinde und sehbehinderte Nutzer bei der Installation des Adobe Readers beachten müssen. Beschreibung des Installationsvorgangs und der zu beachtenden Einstellungen, damit das Lesen von PDF-Dokumenten optimal gelingt. Installation von XPDF bzw. PDFToText mit Hinweisen für blinde und sehbehinderte Nutzer. GSView und Ghostscript sind für Screenreadernutzer zusätzlich erforderlich zum Adobe Reader, wenn sie PDF-Dokumente mit Sicherheitseinstellungen lesen wollen. Hier finden Sie eine Anleitung zur Installation dieser Software mit Hinweisen zur Bedienung in einem Screenreader. Zum Lesen von PDF-Dokumenten in einer Sprachausgabe ist die Installation einer OCR-Software für viele Fälle sinnvoll. Installation und Hinweise zu Einstellungen werden hier beschrieben für Omnipage Pro 14. Ein Entscheidungsschema für blinde Nutzer, wann sie welches Programm zum Lesen von PDF-Dokumenten einsetzen sollen. Diese umfassen vor allem den Adobe Reader, OCR-Programmen PDFToText (XPDF) und GSView (Ghostscript). Einführung in die Nutzung des Adobe Readers zum Lesen von PDF in Screenreadern. Wie ein Screenreader mit dem Adobe Reader über MSAA und andere Methoden arbeitet. Die Bedienung des Adobe Readers mit der Tastatur ist für Screenreadernutzer wichtig. Das Einscannen von Formularen und die Bereitstellung als PDF reicht nicht aus, um die Zugänglichkeit der Formulare herzustellen. Screenreader benötigen die Auszeichnung mit Tags sowie weitere MSAA-Informationen. Die Verwendung der Adobe Reader-Sprachausgabe zum Vorlesen von PDF-Dokumenten und -Formularen erfordert eine SAPI-kompatible Sprachausgabe. Einige Einstellungen sollten im Adobe Reader vorgenommen werden, wenn Screenreader auf PDF-Dokumente besser zugreifen können sollen. Es gibt verschiedene Möglichkeiten, aus PDF Textdateien zu erstellen. Extrahieren von Text aus einer PDF unter Verwendung eines Screenreaders. Umwandlung von PDF nach Text mit PDFToText: Was Screenreadernutzer beachten müssen. Umwandeln von PDF nach Text mit GSView. Die Verwendung von PDF in Screenreadern ist oft problematisch. Diese Seite beschreibt, wie blinde Nutzer PDF-Dokumente mit einer OCR-Software (Omnipage Pro 12 und 14, An Open Book 6 und 7) in ein zugängliches Format wie Microsoft Word umwandeln können. Umwandlung einer PDF in eine Screenreader-fähigen Datei über einen kostenlosen Web-Service. Hintergrundwissen zu Tagged PDF oder Verschlüsselungsmöglichkeiten kann Screenreadernutzern bei der Interpretation von Fehlermeldungen hilfreich sein. Probleme im Screenreader bereiten können Konflikte im Zusammenspiel verschiedener Versionen von z.B. PDF-, Adobe Reader und der Verschlüsselungstechnik. Bei der Verschlüsselung von PDF-Dokumenten ist die richtige Vorgehensweise besonders wichtig, um die Zugänglichkeit für Screenreadernutzer zu gewährleisten. Tags sind beim Lesen und beim Export in andere Formate notwendig, damit Screenreadernutzer die Struktur der Inhalte nachvollziehen können. (Aktuelle Seite) Blinde Nutzer sind bei der Verwendung von PDF-Dokumenten immer noch stark benachteiligt. Hersteller und Autoren könnten diese Situation verbessern. Einige Artikel/Bücher und Online-Ressourcen zur Barrierefreiheit von PDF. Einige Angaben zu Oliver Nadig. Die folgenden Begriffe dieser Seite werden auch im Glossar definiert:Lesen, was drinsteht — rausholen, was drinsteckt: Wie blinde Computernutzer sich PDF-Dokumente zugänglich machen besteht aus folgenden einzelnen Webseiten:
1. Klagelied eines frustrierten PDF-Neulings
2. Nützliche Software zum Lesen und Umwandeln von PDF-Dateien
2.1 Installation und Konfiguration des Adobe Readers
2.2 Installation von XPDF
2.3 Installation von GhostScript und GSView
2.4 Installation und Konfiguration von Omnipage Pro
3. Wann wird welches Programm eingesetzt? — ein Entscheidungsschema
4. Lesen, was drinsteht: Den Adobe Reader im Griff
4.1 Wie Screenreader und Adobe Reader zusammenarbeiten
4.2 PDF-Dokumente im Adobe Reader lesen
4.3 Formularbearbeitung mit dem Adobe Reader
4.4 Die Sprachausgabe des Adobe Readers
4.5 Weitere Einstellungstipps für den Adobe Reader
5. Rausholen, was drinsteckt: PDF in Text umwandeln
5.1 Von PDF nach Text mit dem Adobe Reader
5.2 Von PDF nach Text mit PDFToText
5.3 Von PDF nach Text mit GSView
5.4 Von PDF nach Text per Texterkennungsprogramm
5.5 Von PDF nach Text oder HTML per Internet
6. Noch mehr Hintergrundwissen zu PDF
6.1 Die sieben Versionen des PDF
6.2 Verschlüsselt und versiegelt? — Die PDF-Sicherheitseinstellungen
6.3 PDF mit und ohne Tags
6.4 Zur fertigen PDF-Datei auf tausend (Irr)wegen
7. Zugänglichkeit von PDF für Blinde: Eine kritische Bilanz
Weiterführende Literaturhinweise
Über den Autor
Blättern zur nächsten oder vorherigen Seite