Big Data

Typ Vorlesung mit integrierter Übung
Dozent H. Martin Bücker, Frank Taubert
Credit points 6 ECTS = 4 SWS
Nächste Möglichkeit WS 2017/2018
Friedolin Search in Friedolin

Beschreibung:

Das Thema "Big Data" ist nicht erst seit der Diskussion um die systematische Erfassung von personenbezogenen Daten aus allen Lebensbereichen durch internationale Nachrichtendienste und global operierenden Internet-Firmen in aller Munde. Die Analyse von großen und heterogenen Datenmengen etabliert sich in der modernen Wissensgesellschaft zunehmend als eine der methodischen Kernkompetenzen von Informatik und Mathematik. Ziel dieser Lehrveranstaltung sind jedoch nicht die zugrundeliegenden Methoden der Datenanalyse, sondern der praktische Umgang mit Systemen, mit denen solche Analysen heute durchgeführt werden. Insbesondere werden die parallelen Programmiermodelle MapReduce und Spark vorgestellt und in praktischen Übungen vertiefend behandelt. Ziel der Lehrveranstaltung ist neben dem Erlernen der Programmierung solcher Big-Data-Systeme vor allem die Fähigkeit, die versteckten Performance-Engpässe von solchen Programmen erkennen zu können und durch geeignete Mittel umgehen zu können.

Verwendung/Relevanz

Diese einführende Vorlesung ist geeignet für Studierende zu Beginn des Masterstudiums, kann aber auch am Ende eines Bachelorstudiums gehört werden. Kenntnisse in serieller Programmierung werden vorausgesetzt. Dagegen sind Kenntnisse in traditionellen parallelen Programmiermodellen (MPI, OpenMP, CUDA) nicht notwendig und auch nicht wirklich hilfreich.

Studiengänge:

Master Computational and Data Science Pflichtbereich
Master Informatik Wahlpflichtbereich Informatik und Vertiefung Informatik
Geeignet auch für Studierende aus naturwissenschaftlichen Fachrichtungen