Hauptnavigation

Wissensentdeckung in Datenbanken

Veranstaltung Wochentag Termin Ort
042797 Montag 10.15 - 12.00 HG1/HS2
042797 Donnerstag 14.15 - 16.00 HG1/HS2

4V + 2 Ü

Beginn: 11.04.2005

Lehrverantwortliche

Prof. Dr. Katharina Morik
H.-Dz. Dr. Andreas Christmann

Inhalt

Die Vorlesung gibt einen Überblick über das Zusammenspiel von Datenmanagement und Datenanalyse in großen Datenbanken. Der Prozess der Datenanalyse wird anhand des CRISP-Modells vorgestellt, eine Unterstützung der Vorverarbeitungsschritte bietet das System MiningMart.
Für die einzelnen Schritte des Datenanalyseprozesses werden jeweils typische Verfahren vermittelt. Die Verfahren reichen von einfachen Datenbankoperationen, wie z.B. SQL-Anfragen an die Datenbank, bis zu komplexen Datenanalyseverfahren aus Statistik oder Maschinellem Lernen. Als besonders wichtige Data Mining Methoden werden Klassifikations- und Clustering-Verfahren eingeführt, darunter die k-means-Methode, das Bestimmen von Entscheidungsbäumen, Assoziationsregeln und logischer Regeln, das Berechnen von DataCubes und die Stützvektormethode. Einen Schwerpunkt bildet auch die Abschätzung der Glaubwürdigkeit der Ergebnisse mit Hilfe von geeigneten Testdesigns wie z.B. Kreuzvalidierung oder Bootstrapping.
In den Übungen wird Datenmanagement und Datenanalyse anhand von Daten aus der Praxis eingeübt.

Interdisziplinäre Veranstaltung

Diese Veranstaltung finden im interdisziplinären Rahmen zusammen mit dem Fachbereich Statistik statt.

Vorlesungs- und Übungsmaterialien

Materialien zur Vorlesung wie Folien, Übungsblätter und Datensätze sind hier zu finden:

http://www.statistik.uni-dortmund.de/download/vorlesungen/wissensentdeckung/

Um die Dateien herunterladen zu können sind Zugangsdaten (Name und Passwort) notwendig. Bei Problemen bitte Email an

wissen2004@statistik.uni-dortmund.de

Die Materialien zu den Veranstaltungen von Frau Prof. Dr. Morik können auch hier direkt heruntergeladen werden.

Folien:


Übungsblätter


Daten:


Lösungen:

Hinweise zu den Übungen

Die Übungen finden Mittwoch von 10.00 - 12.00 in CT/ZE 15 statt.

Übungsbetreuer:
Dipl.-Inf. Karsten Lübke, Raum M 732
Dipl.-Inf. Ingo Mierswa, GB IV Raum 117

Allgemeine Hinweise:
  • Die nötige Software für den ersten Teil der Übungen ist in den Rechnerpools M 711 und U18 (Mathegebäude) des Fachbereiches Statistik installiert.
  • Die Daten für die Übungen stehen unter der Webseite zur Verfügung.
  • Für den Übungsschein müssen 9 Übungsaufgaben sinnvoll bearbeitet werden.
  • Abgabe der Übungen jeweils bis Montag 12.00 per Email an wissen2004@statistik.uni-dortmund.de.
  • Zweiergruppen sind erlaubt (Ausnahme: BS/MS Studierende).
  • Die Lösungen müssen verständlich sein (dokumentierter Quelltext etc.).