Hauptnavigation

Trainingsmenge 5: next up previous contents
Weiter: Anzahl der zu lernenden Hoch: Verschachtelte Strukturen Zurück: Trainingsmenge 4:

Trainingsmenge 5:

In den meisten Dokumenten kommen maximal drei bis vier ineinandergeschachtelte Strukturen vor. Eine Obergrenze der Verschachtelung wird durch das Programm gesetzt, mit dem ein Dokument erstellt wird. Da der gr??te Teil der Anwender, die ein Dokument erstellen, Microsoft Word verwenden und die maximal m?gliche Tiefe der Schachtelung hier zehn Ebenen betr?gt, sollten von A D T auch mindestens diese zehn Ebenen erkannt werden.

Um zu ?berpr?fen, ob die Aufgabe - verschachtelte Strukturen korrekt erkennen und klassifizieren - von A D T zufriedenstellend bew?ltigt wird, wurde ein Versuchsdokument mit zehn Ebenen erstellt. Die Abbildung 6.16 zeigt eine Trainingsmenge mit drei Ebenen, die w?hrend des Versuches manuell ausgezeichnet wurde.

Abbildung 6.16: Trainingsmenge 5
\begin{figure}\begin{center} \begin{boxitpara}{box 0.9 setgray fill} \begin{t... ...decrease \\ text text \end{tabbing} \end{boxitpara} \end{center} \end{figure}

Abbildung 6.17: Testmenge 7
\begin{figure}\begin{center} \begin{boxitpara}{box 0.9 setgray fill} \begin{t... ...decrease \\ text text \end{tabbing} \end{boxitpara} \end{center} \end{figure}

Die anschlie?ende Klassifikation der Testmenge 7 (Abbildung 6.17) zeigte, dass alle zehn Ebenen des zweiten Abschnittes korrekt klassifiziert wurden.

Die maximal mit Microsoft Word erstellbaren verschachtelten Strukturen werden also erkannt. Im beschriebenen Versuch wurde zwar eine maximale Verschachtelungstiefe von zehn Ebenen getestet. Die Klassifikation weiterer Ebenen ist allerdings m?glich, solange die Ebenen sich durch die Einr?ckungstiefe bez?glich des linken Seitenrandes unterscheiden. Das Kontrollwort \linN definiert hier die linke Einr?ckung, wobei N angibt, wie tief einger?ckt wird.

In einigen Dokumenten kommen Aufz?hlungen vor, bei denen die einzelnen Aufz?hlungspunkte ?ber eine Zeile hinausgehen. Abbildung 6.18 zeigt zwei verschiedene Arten, wie solche Aufz?hlungen erzeugt werden k?nnen. Nach dem ersten Aufz?hlungspunkt endet der Paragraph. Der n?chste Absatz geh?rt zum vorherigen Aufz?hlungspunkt und wurde deshalb einger?ckt. Beim zweiten Aufz?hlungspunkt wurde am Ende der Zeile der Paragraph nicht beendet, so dass die Aufz?hlung in der folgenden Zeile fortgesetzt wird. Eine Einr?ckung ist hier eigentlich nicht vorhanden, sie wird nur vom Textverarbeitungsprogramm dargestellt. Um die Strukturen in Abbildung 6.18 korrekt klassifizieren zu k?nnen, muss der erste Aufz?hlungpunkt so annotiert werden, dass die erste Zeile als Aufz?hlung (<li>) und die zweite Zeile als einger?ckte Zeile (<indent>) gekennzeichnet wird. Da der komplette zweite Aufz?hlungspunkt ein Paragraph ist, muss er auch nur als Aufz?hlung ausgezeichnet werden.

Abbildung 6.18: Trainingsmenge 6
\begin{figure}\begin{center} \begin{boxitpara}{box 0.9 setgray fill} \begin{t... ...t Text \> \> \> \> <p> \end{tabbing} \end{boxitpara} \end{center} \end{figure}

Abbildung 6.19: Mit der Trainingsmenge 6 gelernter Entscheidungsbaum
\begin{figure}\centering\epsfig{file=bilder/entscheidungsbaum_indent.eps, width=7cm} \end{figure}

Der Entscheidungsbaum in Abbildung 6.19 zeigt, dass die Paragraphen mit Aufz?hlungspunkten das Kontrollwort hich enthalten. Die Abs?tze sind einger?ckt, wenn der Parameter des Kontrollwortes lin einen gr??er Wert als Null aufweist.


next up previous contents
Weiter: Anzahl der zu lernenden Hoch: Verschachtelte Strukturen Zurück: Trainingsmenge 4:
Christian H?ppe, christian.hueppe@web.de