26 Μαΐου - 1 Ιουνίου
Section outline
-
Διάλεξη 25/5: PAC Learning, Online Learning and Online Convex Optimization
- Σύντομη επανάληψη προηγούμενης διάλεξης (ERM, representative sets, σύνδεση Agnostic PAC Learning με Convex Optimization, Gradient Descent)
- Online learning, online convex optimization, regret, no-regret αλγόριθμοι.
- Follow the Leader: ορισμός και ανάλυση του regret.
- Ο ρόλος της ισχυρής κυρτότητας στην ευστάθεια αλγορίθμων της μορφής Follow the Leader.
- Regularization.
- Follow the regularized Leader: ορισμός, παραμετροποίηση με βάση τον regularizer, ανάλυση του regret.
Προτεινόμενη μελέτη:
- Διαφάνειες.
- Σημειώσεις Μ. Ζαμπετάκη.
- Σημειώσεις Β. Συργκάνη.
- Κεφάλαιο 1 και ενότητες 2.1 - 2.5 από Online Learning and Online Convex Optimization.
(ΠΡΟΣΟΧΗ: Απαιτείται συνθηματικό για την πρόσβαση. Το υλικό των διαλέξεων προορίζεται αποκλειστικά για προσωπική χρήση των φοιτητών του μαθήματος και δεν επιτρέπεται η ανάρτησή του ή μεταφόρτωσή του σε οποιοδήποτε άλλο site ή μέσο).