Αλγοριθμική Επιστήμη Δεδομένων
Weekly outline
- Ακαδημαϊκό Έτος 2023-2024
Ακαδημαϊκό Έτος 2023-2024
Το μάθημα προσφέρεται στα πλαίσια του ΔΠΜΣ "Επιστήμη Δεδομένων και Μηχανική Μάθηση", στους Υ.Δ. της ΣΗΜΜΥ, καθώς και σε άλλα μεταπτυχιακά προγράμματα (ΑΛΜΑ, ΕΜΕ, Μαθηματική Προτυποποίηση).
Διαλέξεις
- Παρασκευή, 13:15-16:00, αίθ. 002, Νέο Κτ. Ηλεκτρολόγων ΕΜΠ
(οι φοιτητές του ΑΛΜΑ θα έχουν 1 πρόσθετη ώρα, 16:15-17:00)
Έναρξη
- Παρασκευή 23/2/2024
Διδάσκοντες
- Άρης Παγουρτζής, Καθηγητής (pagour@cs.ntua.gr)
- Δώρα Σούλιου, ΕΔΙΠ (dsouliou@mail.ntua.gr)
Βοηθός διδασκαλίας
- Σταύρος Πετσαλάκης, Υ.Δ. (stpetsalakis@gmail.com)
Βιβλιογραφία
- [MMDS] Mining of Massive Datasets, Jure Leskovec, Anand Rajaraman, and Jeff Ullman
www.mmds.org (book, slides, videos, etc.) - [FDS] Foundations of Data Science, Avrim Blum, John Hopcroft, and Ravindran Kannan
https://www.cs.cornell.edu/jeh/book.pdf - [TSKK] Introduction to Data Mining (2nd ed.), Pang-Ning Tan, Michael Steinbach, Anuj Karpatne, and Vipin Kumar
https://www-users.cs.umn.edu/~kumar001/dmbook/index.php
- Παρασκευή, 13:15-16:00, αίθ. 002, Νέο Κτ. Ηλεκτρολόγων ΕΜΠ
- 1η διάλεξη
1η διάλεξη
Διάλεξη 23/2
- Εισαγωγή - διαδικαστικά (διαφάνειες)
Εισαγωγή στο clustering
Clustering Techniques. (Διαφάνειες, 1-15).
Προτεινόμενη μελέτη: [MMDS] Ενότητες: 7.1, 7.2, 7.3 και 7.4.Περαιτέρω μελέτη: [TSKK] Κεφάλαιο 7
- 2η Διάλεξη
2η Διάλεξη
Διάλεξη 1/3
Σύντομη επισκόπηση του clustering
Clustering Techniques, The curse of dimensionality, Hierarchical clustering, K-means, BFR algorithm, Cure. (Διαφάνειες, 1-56).
Προτεινόμενη μελέτη: [MMDS] Ενότητες: 7.1, 7.2, 7.3 και 7.4.Περαιτέρω μελέτη: [TSKK] Κεφάλαιο 7 - 3η Διάλεξη
3η Διάλεξη
Διάλεξη 15/3
Κατακερματισμός (hashing)
(διαφάνειες U. Zwick από μάθημα Advanced Algorithms, Tel Aviv University):
- Κλειστή και ανοιχτή διευθυνσιοδότηση. Universal hash families. Αλυσίδωση.
- Παράγοντας φόρτου και επίδρασή του στον χρόνο εκτέλεσης.
Παρουσιάστηκαν οι διαφάνειες 1-20.
Προτεινόμενη μελέτη: σημειώσεις (και αναφορές που περιέχονται).