Barrierefreies Webdesign ein zugängliches und nutzbares Internet gestalten

Lesen, was drinsteht — rausholen, was drinsteckt: Wie blinde Computernutzer sich PDF-Dokumente zugänglich machen geschrieben von Oliver Nadig (2005)

Dieser Beitrag wurde von Oliver Nadig in Oktober 2005 verfasst. Die vorliegende Fassung ist die Version 1.02 vom 25.1.2006.

5.1 Von PDF nach Text mit dem Adobe Reader

"Einige wichtige Hinweise vorab:

  1. Wandeln Sie mit dem A.R. nur solche PDF-Dateien in Text um, die sie mit Hilfe des A.R. selbst gut lesen können. Wenn der A.R. Absätze durcheinander würfelt und Tabellen zerpflückt, so erreichen Sie auch durch eine Umwandlung in Text oder durch das Kopieren in die Zwischenablage keine besseren Anzeigeergebnisse.
  2. Ist eine PDF-Datei derart geschützt, dass keine Inhalte entnommen werden dürfen, kann ihr Text weder in die Zwischenablage kopiert noch als Datei abgespeichert werden. Hier hilft nur das Programm GSView, das wir uns in Abschnitt 5.3 anschauen werden.
  3. Der A.R. ist kein Texterkennungsprogramm! Es nützt also nichts zu versuchen, eine aus Grafik bestehende PDF-Datei im Textformat ab zu speichern. Sollte das entstehende Dokument überhaupt irgendwelchen Inhalt haben, dann besteht dieser lediglich aus unlesbarem Buchstabensalat. Der Inhalt Grafischer PDF-Dateien kann nur mit Hilfe von Texterkennungsprogrammen wie 'Omnipage Pro', 'FineReader', 'Openbook' oder Spezialwerkzeugen wie dem 'PDFTransformer' zugänglich gemacht werden (vgl. Abschnitt 5.4).

Mit Hilfe des A.R. können Sie den Inhalt einer PDF-Datei auf zwei Arten entnehmen:

  1. Durch kopieren in die Zwischenablage,
  2. Durch Speichern als Textdatei.

So kopieren Sie den gesamten Text eines PDF-Dokumentes in die Zwischenablage:

  1. Rufen Sie den Menüpunkt 'Bearbeiten > Datei in Zwischenablage kopieren' (ALT+B, Z) auf. Achtung: Verwenden Sie genau diesen Befehl – versuchen Sie nicht, mit den klassischen Textmarkierungsfunktionen oder STRG+A das gesamte Dokument zu markieren um es anschließend mit STRG+C in die Zwischenablage zu kopieren.
  2. Wechseln Sie in ein Textverarbeitungsprogramm – zum Beispiel Microsoft Word und fügen Sie mit STRG+V den Inhalt der Zwischenablage ein.

Hinweis: Sollte der Menübefehl 'Bearbeiten > Datei in Zwischenablage kopieren' nicht verfügbar sein, ist das PDF-Dokument derart geschützt, dass sein Inhalt nicht entnommen werden darf. Sie können sich unter diesen Umständen den Versuch, das Dokument als Textdatei zu speichern, ebenfalls sparen, da dann automatisch auch dieser Menüpunkt nicht verfügbar ist.

Ist die Entnahme des Textes über die Zwischenablage allerdings gelungen, werden sogar einige Formatierungsmerkmale wie Schriftart-, Schriftgrößen-, Schriftstil- und Formatvorlageninformationen nach Microsoft Word übernommen.

So speichern Sie den gesamten Inhalt einer PDF-Datei im Textformat:

  1. Rufen Sie den Menüpunkt 'Datei > Als Text speichern' (ALT+D, T) auf.
  2. Legen Sie im erscheinenden Dialogfenster 'Speichern unter' einen Dateinamen und einen Speicherort für die Datei fest und bestätigen Sie mit der Schaltfläche 'Speichern'. In A.R.7 kann das Speichern sehr lange dauern – dafür ist das Programm sehr gründlich. Den Speicherfortschritt können Sie jederzeit über die Statusleiste verfolgen.

Ist der genannte Menüpunkt nicht verfügbar, so ist die Entnahme von Inhalten aus der PDF-Datei vom Autor untersagt worden. Durch das Speichern im Textformat gehen nahezu sämtliche Textstrukturmerkmale des Ursprungsdokumentes verloren. Sollen Zentrierungen, Einrückungen und hängende Absätze im Textformat noch erkennbar sein, eignet sich der A.R. zur Umwandlung nicht besonders. Setzen Sie dann das im folgenden Abschnitt 5.2 besprochene Programm PDFToText ein."

"Sie haben mir eben von den 'klassischen' Textmarkierungstechniken im A.R. abgeraten – warum?"

"Erinnern Sie sich daran, dass sie mit den meisten Screenreadern in einer vom eigentlichen A.R.-Fenster losgelösten Dokumentdarstellung arbeiten – Stichwort 'virtueller PC-Cursor' bei JAWS oder 'DocumentWizard' bei Virgo. Natürlich können Sie in dieser Darstellung Text mit Hilfe der Umschalttaste und den Pfeiltasten markieren, Sie können auch STRG+A drücken. Denken Sie aber daran, dass große PDF-Dokumente dem Screenreader seitenweise übermittelt werden. Wenn Sie STRG+A drücken, markieren Sie unter Umständen nur den Text der aktuellen Seite, nicht aber das vollständige Dokument. Außerdem werden nicht die Originalformatierungen der PDF-Datei verwendet; der Text wird so in die Zwischenablage übernommen, wie er Ihnen mit JAWS, Virgo, dem WebFormator oder einem anderen Screenreader angezeigt wird."