Wenn das Ergebnis der Klassifikation den W?nschen des Benutzers entspricht,
kann das Dokument abgespeichert werden. Hierf?r ist in der Werkzeugleiste
(Abbildung 5.1, Punkt 2) das Diskettensymbol zu w?hlen. Zur
Speicherung des strukturierten Dokumentes ist standardm??ig das HTML-Format
vorgegeben. Abbildung 5.5 zeigt einen Auszug aus einem mit A D T erzeugten Text. Neben der Speicherung des Textes im HTML-Format stehen noch
weitere Formate zur Verf?gung. Die meisten dienten bei der Entwicklung von
A D T Testzwecken, so lassen sich beispielsweise alle im Dokument vorkommenden
Attribute speichern, weiterhin besteht die M?glichkeit, Formate f?r das
Modellierungssystem MOBAL23 zu erzeugen. Da
diese Formate in Hinblick auf diese Diplomarbeit nicht weiter von Bedeutung
sind, werden sie hier nicht n?her erkl?rt.
Abbildung 5.5:
Ein mit Hilfe von ADT annotiertes Dokument
Ein Format, welches allerdings erw?hnt werden sollte, ist das
ARFF-Format. ARFF ist das in der Lernumgebung WEKA verwendete
Dateiformat. Interessant ist die M?glichkeit, manuell ausgezeichneten
Paragraphen im ARFF-Format zu speichern in so fern, dass die Daten mit Hilfe
der WEKA-Umgebung verarbeitet werden k?nnen. Dem Benutzer steht so die
M?glichkeit offen, andere Einstellungen an den in A D T verf?gbaren
Algorithmen vorzunehmen.