Lesen, was drinsteht — rausholen, was drinsteckt: Wie blinde Computernutzer sich PDF-Dokumente zugänglich machen geschrieben von Oliver Nadig (2005)
Dieser Beitrag wurde von Oliver Nadig in Oktober 2005 verfasst. Die vorliegende Fassung ist die Version 1.02 vom 25.1.2006.
5. Rausholen, was drinsteckt: PDF in Text umwandeln
"Es kann mehrere Gründe geben, warum Sie eine bestehende PDF-Datei in ein zugänglicheres Dokumentenformat umwandeln möchten:
- Sie möchten die Datei in einem gewohnten Textverarbeitungsprogramm lesen und können auf einige Merkmale des Originals (Schriftart-, Schriftgrößen- und Schriftformatierungsinformationen, Links und Tabellen) verzichten.
- Das Dokument soll in Punktschrift übertragen werden.
- Der A.R. weigert sich aufgrund der Sicherheitseinstellungen des Dokumentes, etwas vor zu lesen.
- Die PDF-Datei besteht aus reiner Grafik und kann deshalb vom Screenreader nicht unter Verwendung des A.R. gelesen werden.
In diesem Kapitel bespreche ich mit Ihnen fünf Möglichkeiten, an den Text einer PDF-Datei zu gelangen:
- Mit Hilfe des A.R. (Abschnitt 5.1),
- mit Hilfe des Programms PDFToText (Abschnitt 5.2),
- mit Hilfe des Programmpaares AFPL GhostScript/GSView (Abschnitt 5.3),
- mit Hilfe von Texterkennungsprogrammen (Unterabschnitte von Abschnitt 5.4) und
- über einen Internet Service der Firma Adobe Systems (Abschnitt 5.5)."
Der Beitrag Lesen, was drinsteht — rausholen, was drinsteckt: Wie blinde Computernutzer sich PDF-Dokumente zugänglich machen besteht aus folgenden einzelnen Webseiten:
- 1. Klagelied eines frustrierten PDF-Neulings
Besonders die schlechte Aufbereitung von PDF-Dokumenten verstellt blinden Nutzern oft die selbständige Verwendung der Dokumente.
- 2. Nützliche Software zum Lesen und Umwandeln von PDF-Dateien
Neben dem Adobe Reader bietet weitere Software die Möglichkeit für Screenreadernutzer, auf den Inhalt von PDF-Dokumenten zuzugreifen.
- 2.1 Installation und Konfiguration des Adobe Readers
Was blinde und sehbehinderte Nutzer bei der Installation des Adobe Readers beachten müssen. Beschreibung des Installationsvorgangs und der zu beachtenden Einstellungen, damit das Lesen von PDF-Dokumenten optimal gelingt.
- 2.2 Installation von XPDF
Installation von XPDF bzw. PDFToText mit Hinweisen für blinde und sehbehinderte Nutzer.
- 2.3 Installation von GhostScript und GSView
GSView und Ghostscript sind für Screenreadernutzer zusätzlich erforderlich zum Adobe Reader, wenn sie PDF-Dokumente mit Sicherheitseinstellungen lesen wollen. Hier finden Sie eine Anleitung zur Installation dieser Software mit Hinweisen zur Bedienung in einem Screenreader.
- 2.4 Installation und Konfiguration von Omnipage Pro
Zum Lesen von PDF-Dokumenten in einer Sprachausgabe ist die Installation einer OCR-Software für viele Fälle sinnvoll. Installation und Hinweise zu Einstellungen werden hier beschrieben für Omnipage Pro 14.
- 3. Wann wird welches Programm eingesetzt? — ein Entscheidungsschema
Ein Entscheidungsschema für blinde Nutzer, wann sie welches Programm zum Lesen von PDF-Dokumenten einsetzen sollen. Diese umfassen vor allem den Adobe Reader, OCR-Programmen PDFToText (XPDF) und GSView (Ghostscript).
- 4. Lesen, was drinsteht: Den Adobe Reader im Griff
Einführung in die Nutzung des Adobe Readers zum Lesen von PDF in Screenreadern.
- 4.1 Wie Screenreader und Adobe Reader zusammenarbeiten
Wie ein Screenreader mit dem Adobe Reader über MSAA und andere Methoden arbeitet.
- 4.2 PDF-Dokumente im Adobe Reader lesen
Die Bedienung des Adobe Readers mit der Tastatur ist für Screenreadernutzer wichtig.
- 4.3 Formularbearbeitung mit dem Adobe Reader
Das Einscannen von Formularen und die Bereitstellung als PDF reicht nicht aus, um die Zugänglichkeit der Formulare herzustellen. Screenreader benötigen die Auszeichnung mit Tags sowie weitere MSAA-Informationen.
- 4.4 Die Sprachausgabe des Adobe Readers
Die Verwendung der Adobe Reader-Sprachausgabe zum Vorlesen von PDF-Dokumenten und -Formularen erfordert eine SAPI-kompatible Sprachausgabe.
- 4.5 Weitere Einstellungstipps für den Adobe Reader
Einige Einstellungen sollten im Adobe Reader vorgenommen werden, wenn Screenreader auf PDF-Dokumente besser zugreifen können sollen.
- 5. Rausholen, was drinsteckt: PDF in Text umwandeln
(Aktuelle Seite)
- 5.1 Von PDF nach Text mit dem Adobe Reader
Extrahieren von Text aus einer PDF unter Verwendung eines Screenreaders.
- 5.2 Von PDF nach Text mit PDFToText
Umwandlung von PDF nach Text mit PDFToText: Was Screenreadernutzer beachten müssen.
- 5.3 Von PDF nach Text mit GSView
Umwandeln von PDF nach Text mit GSView.
- 5.4 Von PDF nach Text per Texterkennungsprogramm
Die Verwendung von PDF in Screenreadern ist oft problematisch. Diese Seite beschreibt, wie blinde Nutzer PDF-Dokumente mit einer OCR-Software (Omnipage Pro 12 und 14, An Open Book 6 und 7) in ein zugängliches Format wie Microsoft Word umwandeln können.
- 5.5 Von PDF nach Text oder HTML per Internet
Umwandlung einer PDF in eine Screenreader-fähigen Datei über einen kostenlosen Web-Service.
- 6. Noch mehr Hintergrundwissen zu PDF
Hintergrundwissen zu Tagged PDF oder Verschlüsselungsmöglichkeiten kann Screenreadernutzern bei der Interpretation von Fehlermeldungen hilfreich sein.
- 6.1 Die sieben Versionen des PDF
Probleme im Screenreader bereiten können Konflikte im Zusammenspiel verschiedener Versionen von z.B. PDF-, Adobe Reader und der Verschlüsselungstechnik.
- 6.2 Verschlüsselt und versiegelt? — Die PDF-Sicherheitseinstellungen
Bei der Verschlüsselung von PDF-Dokumenten ist die richtige Vorgehensweise besonders wichtig, um die Zugänglichkeit für Screenreadernutzer zu gewährleisten.
- 6.3 PDF mit und ohne Tags
Tags sind beim Lesen und beim Export in andere Formate notwendig, damit Screenreadernutzer die Struktur der Inhalte nachvollziehen können.
- 6.4 Zur fertigen PDF-Datei auf tausend (Irr)wegen
"Viele Wege führen nach Rom" — aber nur die richtige Technik im PDF-Erstellungsprozess führt zu zugänglichen Dokumenten.
- 7. Zugänglichkeit von PDF für Blinde: Eine kritische Bilanz
Blinde Nutzer sind bei der Verwendung von PDF-Dokumenten immer noch stark benachteiligt. Hersteller und Autoren könnten diese Situation verbessern.
- Weiterführende Literaturhinweise
Einige Artikel/Bücher und Online-Ressourcen zur Barrierefreiheit von PDF.
- Über den Autor
Einige Angaben zu Oliver Nadig.
Die folgenden Begriffe dieser Seite werden auch im Glossar definiert: