Die Vorlesung Wissenentdeckung in Datenbanken ist eine Einführung in die Datenanalyse sowohl aus Sicht der Statistik als auch der Informatik. Sie wird in diesem Jahr von Herrn Prof. Dr. Claus Weihs (Statistik) und Frau Prof. Dr. Katharina Morik (Informatik) gehalten.
Alle Informationen zur Vorlesung und zum Übungsbetrieb findet ihr grundsätzlich auf der Seite der Statistiker:
Für den Zugang benötigt ihr einen Benutzernamen und ein Kennwort, welche in der Vorlesung bzw. den Übungen bekannt gegeben werden. Auf der Seite, auf der ihr euch gerade befindet, stellen wir den Informatik-Teil der Vorlesung ohne Zugangsbeschränkung zur Verfügung.
Aktuelle Termine für diese Veranstaltung sind:
Die Anmeldung zu den Übungen erfolgte in der ersten Vorlesung. Die Aufteilung der Teilnehmer auf die Gruppen kann hier eingesehen werden:
Die genauen Uhrzeiten und Modalitäten zu den Abgaben, dem Scheinerwerb und den Pool-Accounts könnt ihr dem folgenden Info-Blatt entnehmen:
Bei Fragen zur Vorlesung oder den Übungen helfen euch - je nach Schwerpunkt - gerne die Übungsgruppenleiter weiter:
Die Übungsaufgaben erfordern teilweise den Einsatz der in der ersten Übung vorgestellten Softwarepakete R und RapidMiner.
Hier findet Ihr die Übungsblätter und dazugehörige Begleitmaterialien (z. B. Datensätze).
Nachfolgend findet ihr während der Vorlesung eine laufend aktualisierte Liste der Vorlesungsinhalte für den Informatik-Teil. Die Auflistung garantiert keine Vollständigkeit und ist nicht als Grundlage für Prüfungsvorbereitungen, sondern lediglich als Erinnerung/Überblick zu verstehen.
14.04.2009 |
Motivation zum Thema Wissenentdeckung in Datenbanken Überblick über Einsatzfelder von Data Mining und Statistik Statistik-Grundlagen Inhalte und Zeitplan der Vorlesung |
Folien: 1DMVintro.pdf 1DMVintro_4p.pdf (Druckversion) |
21.04.2009 |
Lineare Modelle Bias-Varianz-Problem |
Folien: 2DMVBiasVar.pdf 2DMVBiasVar_4p.pdf |
23.04.2009 |
k Nächste Nachbarn Ähnlichkeitsmaße Funktionsapproximation Modellselektion |
Folien: 3DMVkNN.pdf 3DMVkNN_4p.pdf |
28.04.2009 |
Basisexpansion und Strafterm Generelle additive Modelle Baumlerner |
Folien: 4DMVadditive.pdf 4DMVadditive_4p.pdf |
26.05.2009 |
Hinführungen zur SVM Maximum Margin Methode Lagrange-Optimierung Weich trennende SVM |
Folien: 5DMVsvm1.pdf 5DMVsvm1_4p.pdf |
28.05.2009 |
Lösung des Optimierungsproblems Kernfunktionen Bias und Varianz bei SVM Anwendungen |
Folien: 5DMVsvm2.pdf 5DMVsvm2_4p.pdf |
09.06.2009 |
Textkategorisierung mit SVMs Web Mining Information Retrieval Textklassifikation Verwendung des Modells |
Folien: 5DMVsvm3.pdf 5DMVsvm3_4p.pdf |
16.06.2009 |
Strukturelle Modelle Primales Problem Duales Problem Optimierung der SVMstruct Anwendungen |
Folien: 6DMVstrukt.pdf 6DMVstrukt_4p.pdf |
18.06.2009 |
Lernaufgabe Cluster-Analyse Abstandsmaße Optimierungsprobleme K-Means Agglomeratives Clustering |
Folien: 7MLVcluster.pdf 7MLVcluster_4p.pdf Folien mit korrektem Titel und Datum folgen! |
14.07.2009 |
Data Cube APRIORI |
Folien: 7DMVDataCube.pdf 7DMVDataCube_4p.pdf 7DMVApriori.pdf 7DMVApriori_4p.pdf |
16.07.2009 |
FP-Growth MinEx LTree |
Folien: 7DMVMinEx.pdf 7DMVMinEx_4p.pdf 7DMVLTree.pdf 7DMVLTree_4p.pdf |
21.07.2009 |
Frequent Itemsets über Datenströmen Problemdefinition Online-Algorithmen Experimente |
Folien: 8DMVHHH.pdf 8DMVHHH_4p.pdf |
Seitenentwurf und Grafik von Christian Bockermann