Hauptnavigation

Schritt 4: Ergebnisse speichern next up previous contents
Weiter: Schritt 5: Entscheidungsbaum ansehen Hoch: Anwendung am Beispiel Zurück: Schritt 3: Automatische Klassifikation

Schritt 4: Ergebnisse speichern

Wenn das Ergebnis der Klassifikation den W?nschen des Benutzers entspricht, kann das Dokument abgespeichert werden. Hierf?r ist in der Werkzeugleiste (Abbildung 5.1, Punkt 2) das Diskettensymbol zu w?hlen. Zur Speicherung des strukturierten Dokumentes ist standardm??ig das HTML-Format vorgegeben. Abbildung 5.5 zeigt einen Auszug aus einem mit A D T erzeugten Text. Neben der Speicherung des Textes im HTML-Format stehen noch weitere Formate zur Verf?gung. Die meisten dienten bei der Entwicklung von A D T Testzwecken, so lassen sich beispielsweise alle im Dokument vorkommenden Attribute speichern, weiterhin besteht die M?glichkeit, Formate f?r das Modellierungssystem MOBAL23 zu erzeugen. Da diese Formate in Hinblick auf diese Diplomarbeit nicht weiter von Bedeutung sind, werden sie hier nicht n?her erkl?rt.

Abbildung 5.5: Ein mit Hilfe von ADT annotiertes Dokument
\begin{figure}\verbatimtabinput[4]{listing/html1.txt} \end{figure}

Ein Format, welches allerdings erw?hnt werden sollte, ist das ARFF-Format. ARFF ist das in der Lernumgebung WEKA verwendete Dateiformat. Interessant ist die M?glichkeit, manuell ausgezeichneten Paragraphen im ARFF-Format zu speichern in so fern, dass die Daten mit Hilfe der WEKA-Umgebung verarbeitet werden k?nnen. Dem Benutzer steht so die M?glichkeit offen, andere Einstellungen an den in A D T verf?gbaren Algorithmen vorzunehmen.


next up previous contents
Weiter: Schritt 5: Entscheidungsbaum ansehen Hoch: Anwendung am Beispiel Zurück: Schritt 3: Automatische Klassifikation
Christian H?ppe, christian.hueppe@web.de