Der direkte Zugriff
"Tagged PDF" setzt die Anwendung von Software voraus, mit der sich Strukturen zuweisen lassen und die mit Acrobat zusammenarbeitet. Im Wesentlichen sind es die Produkte von Adobe und Microsoft, die diese Voraussetzungen erfüllen. Sowohl in Anwendungen wie Adobe FrameMaker SGML 6.0, FrameMaker 7.0, InDesign 2.0, InDesign CS 1, InDesign CS2 oder PageMaker 7.0 als auch in Microsoft-Office-Anwendungen (ab 2000 und nur unter Windows) können Strukturinformationen einzelnen Texten zugewiesen werden. Hingegen bieten QuarkXPress oder Macromedia-Produkte diese Möglichkeit nicht und erfordern eine Nachbearbeitung. Von erzeugten PDF-Dokumenten in Adobe Acrobat Professional (Version 6 oder 7) bzw. "MakeAccessible" (Adobe Acrrobat 5). Für die Erstellung barrierefreier PDF-Formulare empfiehlt sich die Kombination aus Adobe Acrobat 7 Professional und Adobe LiveCycle Designer 7.
Für textbasierte Dokumente mit einfachem Layout eignet sich das Zusammenspiel von Microsoft Word und Acrobat. Dabei ist in Word unbedingt das Acrobat Plug-In "PDFMaker" zu benutzen. Es entspricht der jeweiligen Acrobat-Version, die installiert ist. Der viel genutzte Weg über das Druckmenü (PDFWriter, Acrobat Distiller oder andere Druckertreiber und PostScript-Konverter) eignet sich nicht, um Strukturinformationen in PDF zu übertragen.
Microsoft Word, mit ausgeklapptem Menü "Acrobat". Nur von diesem Menü aus lassen sich tagged PDF erzeugen.
Das Zusammenspiel zwischen Word und PDFMaker ist sehr sensibel und Virenschutzprogramme oder andere Anwendungen können die Konvertierung beeinflussen und sogar Abstürze verursachen. In diesem Fall empfiehlt es sich, solche Anwendungen zeitweise zu deaktivieren bzw. zu schließen.
Liegt ein PDF-Dokument ohne Strukturen vor und ist die Originaldatei nicht strukturierbar, so bleibt nur die Möglichkeit, Strukturen in Acrobat nachträglich von Hand anzulegen. Bei einfachen Dokumenten, die eine visuell gut unterscheidbare Struktur erkennen lassen, lohnt sich ein Versuch über die Acrobat-Funktionen zur automatischen Strukturierung:
| Funktionalität | Adobe Acrobat 5 | Adobe Acrobat 6 Professional | Adobe Acrobat 7 Professional |
|---|---|---|---|
| PDF-Dokument automatisch mit Tags versehen | Kostenloses Plug-In "MakeAccessible" installieren |
|
|
Acrobat versucht dabei ein Dokument auf erkennbare Strukturen zu analysieren, welche auf Textgröße, Farbe usw. basieren. Es wird versucht, Struktur- und Unicode-Informationen anzulegen. Je nach Dokumenttyp reicht das Ergebnis von akzeptabel bis unbrauchbar. Ein manuelles Überprüfen und Nacharbeiten ist unverzichtbar.
PDF-Dokumente nachzubearbeiten, weil die Anwendung, aus der sie erzeugt wurden keine Strukturinformationen unterstützt oder weil die erforderlichen Methoden zur Erzeugung von Strukturinformationen nicht angewendet wurden, können sehr aufwändig werden. Auch wenn Acrobat 7 vereinfachte Werkzeuge für das Überarbeiten anbietet, so muss der komplette Vorgang jedes Mal wiederholt werden, wenn sich etwas in der Originaldatei geändert hat.
Bei komplexeren Dokumenten empfiehlt es sich, in der Navigationsregisterkarte "Tags" einen Tag-Baum manuell anzulegen oder in Acrobat 7 über das TouchUp-Leserichtungwerkzeug eine erste grobe Strukturierung vorzunehmen. Das anschließende Nacharbeiten (Umbenennen, Zuweisen, Anlegen, Löschen, Verschieben, Alternativtext erstellen, usw.) ermöglicht, die Tags auf die tatsächliche Bedeutungsstruktur des Dokumentes hin zu optimieren.
Beim Erstellen von PDF-Dokumenten über das Einscannen von Vorlagen wird nach der Texterkennung analog zu den obigen Möglichkeiten verfahren. Adobe Acrobat 7 Professional bietet hier die Möglichkeit, Scannen, Texterkennung und Tagging in einem Arbeitsschritt zu erledigen:
Acrobat 7: Dialogfeld mit den optimalen Einstellungen für ein deutschsprachiges Dokument.
Damit das Ergebnis in Acrobat weiterverarbeitet werden kann muss noch unter "PDF-Ausgabestil" der Punkt "Formatierter Text & Grafiken" und für die zu erstellende Datei in den Einstellungen des Scanners "in der Anwendung öffnen" ausgewählt sein .
Für Acrobat 5 muss "PaperCapture" zusätzlich installiert werden, um den OCR-Vorgang durchführen zu können. Die kostenlose Variante erlaubt das Einscannen von 50 Seiten. Größere Dokumente müssen mit der kostenpflichtigen Variante von "PaperCapture" oder einer anderen OCR-Software durchgeführt werden.
Liegt eine durch Einscannen erzeugte PDF-Datei ohne vorherige Texterkennung vor, so muss beim Aufruf der Texterkennung in Acrobat ebenfalls als Ausgabestil "Formatierter Text & Grafiken" gewählt werden.
Lesen Sie,
warum ich mich an die Standards halte und warum das Layout mit
Cascading Style Sheets statt Tabellen oder Frames gestaltet wurde. Sollten Sie Probleme mit dem Layout haben, so finden Sie in der
Liste standardkonformer Browser Links zu entsprechenden Download-Seiten.
Die
Gesamtübersicht dieses Webauftrittes erreichen Sie jederzeit über das AccessKey-Pad mit Alt+6.
Verwenden Sie
Tastenkürzel, etwa Alt mit der entsprechenden Zahl, um auf diesem Webauftritt zu navigieren.