Hauptnavigation

Pages about teaching are available in German only Zurück zu der Liste der Abschlussarbeiten

Offene Abschlussarbeiten

Copula-basierte generierung synthetischer Daten für die Clusteranalyse

Title Copula-basierte generierung synthetischer Daten für die Clusteranalyse
Description

Viele Methoden und Algorithmen (bspw. k-means clustering) funktionieren gut, solange die Daten aus schön getrennten Normalverteilungen stammen, scheitern aber bei komplexeren Verteilungen. Um die Stärken und Schwächen der Algorithmen besser verstehen zu können sollen in dieser Bachelorarbeit komplexere Datengeneratoren entwickelt werden, basierend auf Copulae mit denen der funktionale Zusammenhang der Randverteilungen modelliert werden soll. Insbesondere sollen hier Archimedische Copulae zur Modellierung einer stochastischen Abhängigkeit von komplexeren Randverteilungen (Gamma, Beta, etc.) und zur Simulation von Unsauberkeiten in den Daten umgesetzt werden.

Die Umsetzung soll als Erweiterung der bestehenden Datengeneratoren in dem Open-Source Tool ELKI (Java) erfolgen.

Als Erweiterung können Copula-basierte Datenanalysen umgesetzt werden.

Das Thema eignet sich nur als Bachelorarbeit. Sehr gute Mathematikkenntnisse sind notwendig!

Qualification

Sehr gute Noten in Mathematik und Statistik (Copluae werden die wenigsten gehört haben, aber bspw. "Randverteilung" und "Wahrscheinlichkeitsdichte" sollten vertraut sein!)

Sehr gute Programmierkenntnisse in Java (zur Einarbeitung in die bestehende Codebasis)

Thesistype Bachelorthesis
Second Tutor Schubert, Erich
Professor Schubert, Erich
Status Offen