Hauptnavigation

Analyse natürlicher Sprache

Veranstaltung Wochentag Termin Ort
- Dienstag 10.00 - 12.00 R. U 331
Emil Figge Str. 50
040269 Dienstag 16.00 - 18.00 OH14, Raum E02
Campus Nord
040269 Mittwoch 16.00 - 18.00 OH14, Raum E02
Campus Nord

Inhalt

Eine Fülle von Daten liegt in Form natürlicher Sprache vor und eine Vielzahl von Methoden und Werkzeugen gibt es, mit diesen unstrukturierten Daten umzugehen. Das Fachprojekt soll es den Teilnehmern ermöglichen, sich innerhalb eines Themenkomplexes sowohl auf theoretischer als auch praktischer Ebene zu orientieren. Es werden vier Themen bearbeitet, jedes in einer Gruppe:

  • Textklassifikation mit SVMs
  • Kernel Methoden
  • Annotationen durch Experten aus der Linguistik
  • Feature Extraction
  • Implementierung eines Klassifikators in RapidMiner
Zu einem Thema gehören Grundlagentexte, Tools und weiterführende Texte. Ein Anwendungsbeispiel stammt aus der Germanistik. Neben den wissenschaftlichen Tätigkeiten werden auch Softskills in den Gruppen eingeübt.
Alle Studenten haben die Einführungen zu SVMs und Kernel Methoden durchzuarbeiten. Ab der zweiten Veranstaltungswoche werden Kentnisse darüber vorrausgesetzt. Weitere Details können Sie hier finden.

In der Veranstaltung wird es vier Vorträge geben, die jeweils durch eine Gruppe von vier bis fünf Studenten vorbereitet und gehalten werden. Folgende Themen steht zur Ausswahl:
  • 1. Textklassifikation und String Kernels für SVMs
  • 2. Tree Kernels und Approximation
  • 3. RapidMiner, Textprocessing Plugin, OpenNLP und Stanford Parser
  • 4. LibSVM in RapidMininer und userdefined Kernels. Hier müssen Sie sich den Quellcode von RapidMiner besorgen und die Stellen im Code untersuchen.
Weiter unten gibts es Links zu Literatur zu den einzelnen Vortragsthemen. Sie müssen eigenständig weitere Literatur Hinweis: Registrien Sie sich auf RapidMiner Homepage als Student und laden Sie die Community Version 5 runter. Diese enthäl alle Sourcen. Weiterhin benötigen Sie das Text Mining Plugin, welches Sie aus dem RapidMiner Help/Update RapidMiner raus installieren können.

Aktuelles

Am 18.3. um 14 Uhr und am 21.3 um 14 Uhr findet im Raum 1.48 beim LS8, Joseph-von-Fraunhofer-Strasse 23, 1. Etage, die Vorstellung der Themen und Anwendungen bezogen auf das Fachprojekt. Anschließend werden die Gruppen festgelegt.

Weitere Literatur:

Einführungen (verpflichtend):

1. Textklassifikation und String Kernels für SVMs:

2. Tree Kernels und Approximation:

3. RapidMiner, Textprocessing Plugin, OpenNLP und Stanford Parser:

4. LibSVM in RapidMininer und userdefined Kernels:

Einführungvorträge

Beispieldaten