PG: Kollaboratives Strukturieren von Multimediadaten für Peer-to-Peer Netze

Aufgabe

Peer-to-peer Netzwerke ermöglichen ein dezentrales Anbieten und Suchen von Daten. Um nach Daten suchen zu können, muss man dabei allerdings genau wissen, was man sucht. Dies ist häufig nicht der Fall. Im Internet haben sich als alternative Suchstrategie Webkataloge, wie Yahoo oder Open Directory etabliert, in denen die Daten (in diesem Fall Webseiten) hierarchisch in Kategorien strukturiert sind.

Diese Idee soll nun auf Peer-to-peer Netze übertragen werden. Konsequenterweise, kann in diesem Fall jeder Benutzer sein eigenes, lokales Klassifikationschema haben. Dieses reflektiert die individuelle Sicht dieses Nutzers auf die an seinem Knoten gespeicherten und angebotenen Daten.


Solche lokalen Klassifikationsschemata dienem einem Nutzer zunächst selbst dazu, seine Daten zu verwalten. Sie können aber natürlich auch für andere Nutzer nützlich sein. Im einfachsten Fall können sie anderen dazu dienen, sich durch die Datenkollektion dieses Nutzers zu browsen. Durch den Einsatz von Techniken des Maschinellen Lernens ergeben sich allerdings noch ganz andere Möglichkeiten. Beispielsweise könnte ein Benutzer A die Daten von einem Benutzer B in sein eigenes Klassifikationsschema einsortieren lassen, um so die Daten von B durch seine eigene Brille zu sehen.

Um eine solche Art von Verarbeitung zu ermöglichen, müssen die Daten zunächst geeignet kodiert werden. Dazu werden Methoden der Merkmalsextraktion angewendet. Für Musikstücke heißt das beispielsweise, dass Eigenschaften wie Tempo, Rhythmus, etc. aus den entsprechnden mp3 Dateien extrahiert werden müssen, um diese zu beschreiben. Ein Lernalgorithmus kann dann diese Eigenschaften nutzen, um ähnliche Musikstücke zusammen zu gruppieren. Das Yalesystem, welches hier am Lehrstuhl erstellt wurde, stellt entsprechende Methoden zur Merkmalsextraktion zur Verfügung.

Aufgabe der PG ist es auf Basis des Yale Systems die oben beschriebenen Funktionen auf ein bestehendes Peer-to-Peer System aufzusetzen. Eine konkretere Aufgabenbeschreibung ist im Antragstext zu finden. Wir sind allerdings auch für weitergehende Vorschläge, die sich von Seiten der PG Teilnehmer ergeben, grundsätzlich offen!

Voraussetzungen

Da zur Erfüllung der gegebene Aufgabe verschiedene Kompetenzen benötigt werden, sollten die Teilnehmer entweder über Kenntnisse im Bereich der Verteilten Systeme oder im Bereich der Künstlichen Intelligenz, des Maschinellen Lernens bzw. der Wissensentdeckung in Datenbanken verfügen. In Einzelfällen kann auch eine andere, entsprechende Vorlesung anerkannt werden. Wenden Sie sich dazu am besten direkt an uns.

Weitere Information

Das erste Treffen findet am 3.9.2004 um 10.00 Uhr in Raum 110, GB IV statt. Bei Fragen oder wenn es Schwierigkeiten mit diesem Termin gibt, wenden Sie sich bitte rechtzeitig an uns: wurst@ls8.cs.uni-dortmund.de

Die Folien der PG Vorstellung finden Sie hier: pg_vorstellung.ppt

Weitere Informationen zu dem System Yale finden Sie unter: http://yale.cs.uni-dortmund.de Das Plugin zur Verarbeitung von Audiodaten finden Sie unter Download/Plugins/ValueSeries. Dort liegen auch Beispieldateien.

Einige weitere interessante Links:

Seminarthemen

Eine vorläufige Liste von Seminarthemen jeweils mit Literaturreferenzen haben wir hier zusammengestellt.Die Aufteilung der Seminarthemen sieht folgendermaßen aus:

Thema Vortragender
Kollaborative Informationsagenten Philip Thome
Wissensmanagement und Künstliche Intelligenz Andreas Kaspari
Vorstellung und Vergleich von Agentensystemen und P2P Computing Qing hua Fan
Überblick: Konkrete, erweiterbare, Java basierte P2P/Agentensysteme Matthias Lüttgens
Datenaustausch und Koordinationsprotokolle in Agentensystemen Said Chihani
Algorithmen zur Verteilten Suche und zum Verteilten Indexieren Maxim Martens
(Hierarchische-) Klassifikation Honorine Nguena-Sofak
Clustering von Daten Bülent Möller
Überblick Multimediasuche/indexing Metin Aksoy
Extraktion von Merkmalen aus Audiodaten Oliver Flasch
Werkzeuge für die gemeinsame Softwareentwicklung Umut Öztürk
Softwareentwicklungsparadigmen und Vorgehensweisen Dominique Burgard


Bis zum 1.10. müssen die Vortragsfolien abgegeben werden. Die Vorträge sollten so angelegt sein, dass sie in etwa jeweils eine Stunde dauern. Vom 11.10. - 13.10. findet die Seminarphase jeweils von 10-16 Uhr in Raum 110, GB IV statt.

Intern

Ein Wikibasierter Webbereich zur Verwaltung von internen PG Dokumenten kann hier gefunden werden:

PG Wiki

Das Passwort und der Benutzername wird per mail bekanntgegeben.