Lesen, was drinsteht — rausholen, was drinsteckt: Wie blinde Computernutzer sich PDF-Dokumente zugänglich machen geschrieben von Oliver Nadig (2005)
Dieser Beitrag wurde von Oliver Nadig in Oktober 2005 verfasst. Die vorliegende Fassung ist die Version 1.02 vom 25.1.2006.
5.1 Von PDF nach Text mit dem Adobe Reader
"Einige wichtige Hinweise vorab:
- Wandeln Sie mit dem A.R. nur solche PDF-Dateien in Text um, die sie mit Hilfe des A.R. selbst gut lesen können. Wenn der A.R. Absätze durcheinander würfelt und Tabellen zerpflückt, so erreichen Sie auch durch eine Umwandlung in Text oder durch das Kopieren in die Zwischenablage keine besseren Anzeigeergebnisse.
- Ist eine PDF-Datei derart geschützt, dass keine Inhalte entnommen werden dürfen, kann ihr Text weder in die Zwischenablage kopiert noch als Datei abgespeichert werden. Hier hilft nur das Programm GSView, das wir uns in Abschnitt 5.3 anschauen werden.
- Der A.R. ist kein Texterkennungsprogramm! Es nützt also nichts zu versuchen, eine aus Grafik bestehende PDF-Datei im Textformat ab zu speichern. Sollte das entstehende Dokument überhaupt irgendwelchen Inhalt haben, dann besteht dieser lediglich aus unlesbarem Buchstabensalat. Der Inhalt Grafischer PDF-Dateien kann nur mit Hilfe von Texterkennungsprogrammen wie 'Omnipage Pro', 'FineReader', 'Openbook' oder Spezialwerkzeugen wie dem 'PDFTransformer' zugänglich gemacht werden (vgl. Abschnitt 5.4).
Mit Hilfe des A.R. können Sie den Inhalt einer PDF-Datei auf zwei Arten entnehmen:
- Durch kopieren in die Zwischenablage,
- Durch Speichern als Textdatei.
So kopieren Sie den gesamten Text eines PDF-Dokumentes in die Zwischenablage:
- Rufen Sie den Menüpunkt 'Bearbeiten > Datei in Zwischenablage kopieren' (ALT+B, Z) auf. Achtung: Verwenden Sie genau diesen Befehl – versuchen Sie nicht, mit den klassischen Textmarkierungsfunktionen oder STRG+A das gesamte Dokument zu markieren um es anschließend mit STRG+C in die Zwischenablage zu kopieren.
- Wechseln Sie in ein Textverarbeitungsprogramm – zum Beispiel Microsoft Word und fügen Sie mit STRG+V den Inhalt der Zwischenablage ein.
Hinweis: Sollte der Menübefehl 'Bearbeiten > Datei in Zwischenablage kopieren' nicht verfügbar sein, ist das PDF-Dokument derart geschützt, dass sein Inhalt nicht entnommen werden darf. Sie können sich unter diesen Umständen den Versuch, das Dokument als Textdatei zu speichern, ebenfalls sparen, da dann automatisch auch dieser Menüpunkt nicht verfügbar ist.
Ist die Entnahme des Textes über die Zwischenablage allerdings gelungen, werden sogar einige Formatierungsmerkmale wie Schriftart-, Schriftgrößen-, Schriftstil- und Formatvorlageninformationen nach Microsoft Word übernommen.
So speichern Sie den gesamten Inhalt einer PDF-Datei im Textformat:
- Rufen Sie den Menüpunkt 'Datei > Als Text speichern' (ALT+D, T) auf.
- Legen Sie im erscheinenden Dialogfenster 'Speichern unter' einen Dateinamen und einen Speicherort für die Datei fest und bestätigen Sie mit der Schaltfläche 'Speichern'. In A.R.7 kann das Speichern sehr lange dauern – dafür ist das Programm sehr gründlich. Den Speicherfortschritt können Sie jederzeit über die Statusleiste verfolgen.
Ist der genannte Menüpunkt nicht verfügbar, so ist die Entnahme von Inhalten aus der PDF-Datei vom Autor untersagt worden. Durch das Speichern im Textformat gehen nahezu sämtliche Textstrukturmerkmale des Ursprungsdokumentes verloren. Sollen Zentrierungen, Einrückungen und hängende Absätze im Textformat noch erkennbar sein, eignet sich der A.R. zur Umwandlung nicht besonders. Setzen Sie dann das im folgenden Abschnitt 5.2 besprochene Programm PDFToText ein."
"Sie haben mir eben von den 'klassischen' Textmarkierungstechniken im A.R. abgeraten – warum?"
"Erinnern Sie sich daran, dass sie mit den meisten Screenreadern in einer vom eigentlichen A.R.-Fenster losgelösten Dokumentdarstellung arbeiten – Stichwort 'virtueller PC-Cursor' bei JAWS oder 'DocumentWizard' bei Virgo. Natürlich können Sie in dieser Darstellung Text mit Hilfe der Umschalttaste und den Pfeiltasten markieren, Sie können auch STRG+A drücken. Denken Sie aber daran, dass große PDF-Dokumente dem Screenreader seitenweise übermittelt werden. Wenn Sie STRG+A drücken, markieren Sie unter Umständen nur den Text der aktuellen Seite, nicht aber das vollständige Dokument. Außerdem werden nicht die Originalformatierungen der PDF-Datei verwendet; der Text wird so in die Zwischenablage übernommen, wie er Ihnen mit JAWS, Virgo, dem WebFormator oder einem anderen Screenreader angezeigt wird."
Der Beitrag Lesen, was drinsteht — rausholen, was drinsteckt: Wie blinde Computernutzer sich PDF-Dokumente zugänglich machen besteht aus folgenden einzelnen Webseiten: Besonders die schlechte Aufbereitung von PDF-Dokumenten verstellt blinden Nutzern oft die selbständige Verwendung der Dokumente. Neben dem Adobe Reader bietet weitere Software die Möglichkeit für Screenreadernutzer, auf den Inhalt von PDF-Dokumenten zuzugreifen. Was blinde und sehbehinderte Nutzer bei der Installation des Adobe Readers beachten müssen. Beschreibung des Installationsvorgangs und der zu beachtenden Einstellungen, damit das Lesen von PDF-Dokumenten optimal gelingt. Installation von XPDF bzw. PDFToText mit Hinweisen für blinde und sehbehinderte Nutzer. GSView und Ghostscript sind für Screenreadernutzer zusätzlich erforderlich zum Adobe Reader, wenn sie PDF-Dokumente mit Sicherheitseinstellungen lesen wollen. Hier finden Sie eine Anleitung zur Installation dieser Software mit Hinweisen zur Bedienung in einem Screenreader. Zum Lesen von PDF-Dokumenten in einer Sprachausgabe ist die Installation einer OCR-Software für viele Fälle sinnvoll. Installation und Hinweise zu Einstellungen werden hier beschrieben für Omnipage Pro 14. Ein Entscheidungsschema für blinde Nutzer, wann sie welches Programm zum Lesen von PDF-Dokumenten einsetzen sollen. Diese umfassen vor allem den Adobe Reader, OCR-Programmen PDFToText (XPDF) und GSView (Ghostscript). Einführung in die Nutzung des Adobe Readers zum Lesen von PDF in Screenreadern. Wie ein Screenreader mit dem Adobe Reader über MSAA und andere Methoden arbeitet. Die Bedienung des Adobe Readers mit der Tastatur ist für Screenreadernutzer wichtig. Das Einscannen von Formularen und die Bereitstellung als PDF reicht nicht aus, um die Zugänglichkeit der Formulare herzustellen. Screenreader benötigen die Auszeichnung mit Tags sowie weitere MSAA-Informationen. Die Verwendung der Adobe Reader-Sprachausgabe zum Vorlesen von PDF-Dokumenten und -Formularen erfordert eine SAPI-kompatible Sprachausgabe. Einige Einstellungen sollten im Adobe Reader vorgenommen werden, wenn Screenreader auf PDF-Dokumente besser zugreifen können sollen. Es gibt verschiedene Möglichkeiten, aus PDF Textdateien zu erstellen. (Aktuelle Seite) Umwandlung von PDF nach Text mit PDFToText: Was Screenreadernutzer beachten müssen. Umwandeln von PDF nach Text mit GSView. Die Verwendung von PDF in Screenreadern ist oft problematisch. Diese Seite beschreibt, wie blinde Nutzer PDF-Dokumente mit einer OCR-Software (Omnipage Pro 12 und 14, An Open Book 6 und 7) in ein zugängliches Format wie Microsoft Word umwandeln können. Umwandlung einer PDF in eine Screenreader-fähigen Datei über einen kostenlosen Web-Service. Hintergrundwissen zu Tagged PDF oder Verschlüsselungsmöglichkeiten kann Screenreadernutzern bei der Interpretation von Fehlermeldungen hilfreich sein. Probleme im Screenreader bereiten können Konflikte im Zusammenspiel verschiedener Versionen von z.B. PDF-, Adobe Reader und der Verschlüsselungstechnik. Bei der Verschlüsselung von PDF-Dokumenten ist die richtige Vorgehensweise besonders wichtig, um die Zugänglichkeit für Screenreadernutzer zu gewährleisten. Tags sind beim Lesen und beim Export in andere Formate notwendig, damit Screenreadernutzer die Struktur der Inhalte nachvollziehen können. "Viele Wege führen nach Rom" — aber nur die richtige Technik im PDF-Erstellungsprozess führt zu zugänglichen Dokumenten. Blinde Nutzer sind bei der Verwendung von PDF-Dokumenten immer noch stark benachteiligt. Hersteller und Autoren könnten diese Situation verbessern. Einige Artikel/Bücher und Online-Ressourcen zur Barrierefreiheit von PDF. Einige Angaben zu Oliver Nadig. Die folgenden Begriffe dieser Seite werden auch im Glossar definiert:
Blättern zur nächsten oder vorherigen Seite