Hauptnavigation

Fachprojekt: Data-Mining und Datenanalyse

Veranstaltung Wochentag Termin Ort
INF-BSc-269 Freitags - Seminar 16:00 - 18:00 Uhr OH12, 4.013
Campus Nord
INF-BSc-269 Dienstags - Sprechstunde 14:15 - 15:45 Uhr OH12, 4.016
Campus Nord
INF-BSc-269 Mittwochs - Sprechstunde 14:15 - 15:45 Uhr OH12, 4.016
Campus Nord

Information

Studierende, welche dieses Fachprojekt erfolgreich abgeschlossen haben,

  • kennen die Grundbegriffe sowie gängige Methoden des des spatio-temporal Data-Minings,
  • können Datenanalysealgorithmen implementieren,
  • und können Analyseergebnisse evaluieren und präsentieren.

Anfangs werden in einer Vorlesungsphase die grundlegenden Konzepte der Datenanalyse vermittelt, wobei sowohl praktische als auch theoretische Aspekte behandelt werden. Anschließend findet eine Projektphase statt, in der die Teilnehmer eine zuvor selbsttändig ausgewählte Analysemethode implementieren. Die Implementierung kann wahlweise in JAVA, Python, R oder C++ erfolgen. Mit Hilfe der eigenen Implementierung, führen die Teilnehmer selbständig exemplarische Datenanalysen durch. Die Ergebnisse dieser Analysen werden von den Teilnehmern in einer kurzen Ausarbeitung (Latex, 4-6 Seiten) aufbereitet und abschließend präsentiert (15min Vortrag).

Aktuelles

Die Daten sind online!


Das erste Treffen findet am 23. Oktober 2015 16:00 im Raum OH12 4.013 statt.

Beim ersten Termin werden weitere Termine geplant und eine Einführung gegeben. Erscheinen Sie also zu diesem Termin, falls Sie an der Veranstaltung teilnehmen möchten.

Daten

Downloads

  • C. B. Yildizli, T. Pedersen, Y. Saygin, E. Savas, and A. Levi. 2011. Distributed Privacy Preserving Clustering via Homomorphic Secret Sharing and Its Application to Vertically Partitioned Spatio-Temporal Data. Int. J. Data Warehous. Min. 7, 1 (January 2011), 46-66.
    Direktlink
  • S. V. Kaya, T. Pedersen, E. Savas, and Y. Saygin, 2007. Efficient privacy preserving distributed clustering based on secret sharing. In Emerging Technologies in Knowledge Discovery and Data Mining (pp. 280-291). Springer Berlin Heidelberg.
    Direktlink
  • M. C. Doganay, T. Pedersen, Y. Saygin, E. Savas, and A. Levi. 2008, March. Distributed privacy preserving k-means clustering with additive secret sharing. In Proceedings of the 2008 international workshop on Privacy and anonymity in information society (pp. 3-11). ACM.
    Direktlink
  • J. Liu, J. Li, S. Xu, and B. C. Fung, 2015. Secure Outsourced Frequent Pattern Mining by Fully Homomorphic Encryption. In Big Data Analytics and Knowledge Discovery (pp. 70-81). Springer International Publishing.
    Direktlink
  • Z. Zhou, L. Huang, Y. Wei, and Y. Yun. 2009, May. Privacy preserving outlier detection over vertically partitioned data. In E-Business and Information System Security, 2009. EBISS'09. International Conference on (pp. 1-5). IEEE.
    Direktlink
  • D. Wu, and J. Haven, 2012. Using Homomorphic Encryption for Large Scale Statistical Analysis.
    Direktlink
  • R. Bost, R. A. Popa, S. Tu, and S. Goldwasser, 2014. Machine learning classification over encrypted data. Crypto ePrint Archive.
    Direktlink

Literatur

  • Fachprojekt Folien 23.10.2015 download
  • Übung 1: k-means Clustering mit Cran-R download
  • Übung 2: Frequent Pattern Suche mit apriori Agorithmus in Cran-R download
  • Übung 3: Paillier Cryptosystem mit Beispielen in Cran-R download Cran R Implementation
  • Fachprojekt Folien 18.12.2015 download Springer Latex Template download und Beispieldokument download
  • T. Liebig, Analysis Methods and Privacy Aspects in Spatio-Temporal Data Mining, in AI: Philosophy, Geoinformatics and Law, M. Jankowska, M. Pawelczyk, S. Allouche, and M. Kulawiak, Eds., Warsaw: IUS PUBLICUM, 2015, p. (to appear).
    Direktlink
  • T. Liebig, Privacy Preserving Centralized Counting of Moving Objects, in AGILE 2015, F. Bacao, M. Y. Santos, and M. Painho, Eds., Springer International Publishing, 2015, pp. 91-103.
    Direktlink Cran R Implementation
  • I. Damgård, M Jurik, amd J. B. Nielsen, 2010. A generalization of Paillier’s public-key system with applications to electronic voting. International Journal of Information Security, 9(6), 371-385.
    Direktlink
  • P. Paillier, (1999, January). Public-key cryptosystems based on composite degree residuosity classes. In Advances in cryptology—EUROCRYPT’99 (pp. 223-238). Springer Berlin Heidelberg.
    Direktlink
  • B. Stroustrup, Die C++ Programmiersprache, 4 ed., Addison Wesley, München, Germany, 2000.