Barrierefreies Webdesign ein zugängliches und nutzbares Internet gestalten

Lesen, was drinsteht — rausholen, was drinsteckt: Wie blinde Computernutzer sich PDF-Dokumente zugänglich machen geschrieben von Oliver Nadig (2005)

Dieser Beitrag wurde von Oliver Nadig in Oktober 2005 verfasst. Die vorliegende Fassung ist die Version 1.02 vom 25.1.2006.

5. Rausholen, was drinsteckt: PDF in Text umwandeln

"Es kann mehrere Gründe geben, warum Sie eine bestehende PDF-Datei in ein zugänglicheres Dokumentenformat umwandeln möchten:

  1. Sie möchten die Datei in einem gewohnten Textverarbeitungsprogramm lesen und können auf einige Merkmale des Originals (Schriftart-, Schriftgrößen- und Schriftformatierungsinformationen, Links und Tabellen) verzichten.
  2. Das Dokument soll in Punktschrift übertragen werden.
  3. Der A.R. weigert sich aufgrund der Sicherheitseinstellungen des Dokumentes, etwas vor zu lesen.
  4. Die PDF-Datei besteht aus reiner Grafik und kann deshalb vom Screenreader nicht unter Verwendung des A.R. gelesen werden.

In diesem Kapitel bespreche ich mit Ihnen fünf Möglichkeiten, an den Text einer PDF-Datei zu gelangen:

  1. Mit Hilfe des A.R. (Abschnitt 5.1),
  2. mit Hilfe des Programms PDFToText (Abschnitt 5.2),
  3. mit Hilfe des Programmpaares AFPL GhostScript/GSView (Abschnitt 5.3),
  4. mit Hilfe von Texterkennungsprogrammen (Unterabschnitte von Abschnitt 5.4) und
  5. über einen Internet Service der Firma Adobe Systems (Abschnitt 5.5)."