Das WISDOM-System betrachtet bei der Erstellung von XML-Dokumenten einzelne
zusammengeh?rige, kleine Bl?cke von Zeichen und W?rter die zu gr??eren
Bl?cken zusammengefasst werden. Am Ende der Zusammenfassungen entsprechen die
einzelnen Bl?cke, wie z. B. ?berschriften oder Zusammenfassungen. WISDOM arbeitet
also wie auch A D T auf Paragraphenebene. Die Klassifikation der Abs?tze
geschieht bei beiden System mit Hilfe eines C4.5 Algorithmuses. Klassifiziert
wird dabei nicht in Hinblick auf den Inhalt, sondern in Hinblick auf die
physikalische Darstellung des Dokumentes. Der Unterschied besteht in der
Art der Eingabedaten: Auf der einen Seite klassifiziert WISDOM Bildausschnitte
(Erscheinungsformen) und A D T klassifiziert auf der anderen Seite
Formatierungsanweisungen aus RTF-Dokumenten.