LS 8
General
Research
Teaching
Staff
Internal
SFB876
German
Suche
>
Hauptnavigation
General
Research
Teaching
Staff
Inhalt
Weiter:
Abbildungsverzeichnis
Hoch:
Benutzergeführtes Lernen von Dokument-Strukturauszeichnungen
Zurück:
Benutzergeführtes Lernen von Dokument-Strukturauszeichnungen
Inhalt
Inhalt
Abbildungsverzeichnis
Tabellenverzeichnis
Einleitung
Aufgabenbeschreibung
Aufbau der Diplomarbeit
Markup-Sprachen
Markup-Typen
Generisches Markup
Semantisches Markup
Visuelles Markup
Markup-Sprachen
SGML
XML
HTML
XHTML
Formatvorlagen
L
A
T
E
X
RTF
Word - DOC
Abgrenzung zu bestehenden Systemen
WISDOM++
Vergleich von WISDOM und ADT
Slicing Books
Vergleich der Slicing Book Technologie und ADT
IP4W3
Vergleich von IP4W3 und ADT
Das Gesamtsystem
Komponenten des Systems
Parser
Preprocessing 1: Datenstrukturerzeugung
User Interface
Preprocessing 2: Instanzerzeugung
Lernalgorithmen
Postprocessing
XML Ausgabe
Anwendung am Beispiel
Schritt 1: Dokument einlesen
Schritt 2: Manuelle Auszeichnung von Paragraphen und Umgebungen
Schritt 3: Automatische Klassifikation
Schritt 4: Ergebnisse speichern
Schritt 5: Entscheidungsbaum ansehen
Lernalgorithmen und Versuche
Lernalgorithmen
ID3
C4.5 und J4.8
Versuche
Verschachtelte Strukturen
Anzahl der zu lernenden Strukturen variieren
?hnliche Strukturen
Evaluierung
Wie viele Beispiele werden ben?tigt?
Evaluierung mit J4.8 Algorithmus
Laufzeit im Praxistest
Implementierung
Parser und Tokenizer
Einlesen einer Datei
Tokenizer
Header-Gruppe
Datenbereinigung
Verarbeitung der Paragraphen
Klassifikation
manuelle Auszeichnung
Generierung der Instanzen
Automatische Klassifikation anhand des erzeugten Entscheidungsbaums
Verifikation
Ausgabe des annotierten Dokumentes
Ausblick und Zusammenfassung
Zusammenfassung
Ausblick
Anhang
Erweiterungen
ADT installieren und starten
Literatur
Über dieses Dokument ...
Christian H?ppe,
christian.hueppe@web.de
Anmerkungen zu der Seite bitte an webmaster at example.com Betreff: Anmerkungen zu dieser Seite
Privacy Policy
Imprint