Data Science

Überblick

Dieser Kurs deckt Methoden aus dem Bereich Data Science ab. Konkret konzentrieren wir uns auf Clustering-Algorithmen und probabilistische graphische Modelle & Inferenz und betrachten Textmodellierung und Information Retrieval als Anwendung von Clustering-Ideen und probabilistischer Modellierung.

Inhatlich überschneidet sich die Vorlesung mit der Vorlesung Einführung in die Künstliche Intelligenz aus dem Sommersemester 2022 in geplanten sechs Vorlesungen (PGM Teil).

Randbemerkung: Diese Vorlesung ist so ausgelegt, dass sie das Modul Mustererkennung und Maschinelles Lernen gut ergänzt.

Für weitere Informationen melden Sie sich bitte im Learnweb-Kurs an, sobald er existiert.

Themen (vorläufig) und Präsentationsmaterial

Überblick (pptx, pdf)
Einleitung (pptx, pdf)
Clustering
1. Grundlegende Algorithmen (pptx, pdf)
2. Distanzmaße (pptx, pdf)
3. Bewertungskriterien (pptx, pdf)
4. Weitergehende Algorithmen (pptx, pdf)
Probabilistische graphische Modelle (PGMs)
1. Probabilistische Modellierung (pptx, pdf)
2. Exakte Inferenz (pptx, pdf)
3. Approximative Inferenz (pptx, pdf)
4. Lernalgorithmen (pptx, pdf)
5. Sequentielle PGMs und Inferenz (pptx, pdf)
Textmodellierung & Information Retrieval
1. Vorverarbeitung (pptx, pdf)
2. Information Retrieval und dessen Bewertung
3. Vektor-basierte Verarbeitung (pptx, pdf)
4. Probabilistische Verarbeitung (pptx, pdf)
5. Erweiterung: Korpusannotationen (pptx, pdf)

Literatur

Clustering: folgt
Probabilistic Graphical Models - Principles and Techniques, Daphne Koller und Nir Friedman

Alle Versionen sind online auffindbar.