Hauptnavigation

Erweiterungen: next up previous contents
Weiter: Anhang Hoch: Ausblick Zurück: Verlagerung des Arbeitsaufwands:

Erweiterungen:

Diese Arbeit hat aufgezeigt, dass es m?glich ist Dokument-Strukturauszeichnungen aus Formatierungsmerkmalen maschinell zu lernen. Die Betrachtung der Merkmale erfolgt bei A D T bez?glich eines Absatzes. Interessant w?re, auch die Formatierung einzelner W?rter mit einzubeziehen. So k?nnten auch auf Wortebene Annotationen durchgef?hrt werden. Dies bedeutet allerdings einen starken Anstieg der Komplexit?t, so dass diese Erweiterung nicht leicht durchzuf?hren ist.

Eine weitere Verbesserung des Ansatzes, Strukturauszeichnungen aus Formatierungsmerkmalen zu lernen, br?chte die Unterst?tzung weiterer verbreiteter Formate wie Postscript (PS) oder Portable Document Format (PDF). Zur Zeit gibt es zwar einen »Workaround«, so dass diese Formate in RTF konvertiert werden k?nnen. Ab der Version 5 des Adobe Acrobat ist es m?glich, PDF sowie PS-Dokumente im RTF-Format zu speichern. Da die Konvertierung allerdings nicht immer korrekt funktioniert, ist dieser Umweg keine zufriedenstellende L?sung.

Eine zus?tzliche Erweiterung, welche die Bedienbarkeit von A D T verbessern w?rde, w?re die M?glichkeit, einmal gelernte Entscheidungsb?ume auf mehrere Dokumente anwenden zu k?nnen. In der aktuellen Version muss jedes neu ge?ffnete Dokument auch erneut manuell annotiert werden. Bei Dokumenten die sich bez?glich der Formatierung ihrer Paragraphen nicht unterscheiden, k?nnte so die zweite manuelle Auszeichnung eingespart werden.


next up previous contents
Weiter: Anhang Hoch: Ausblick Zurück: Verlagerung des Arbeitsaufwands:
Christian H?ppe, christian.hueppe@web.de