Weekly outline

  • Ακαδημαϊκό Έτος 2024-2025

    Το μάθημα προσφέρεται στους σπουδαστές του ΔΠΜΣ "Επιστήμη Δεδομένων και Μηχανική Μάθηση", στους Υ.Δ. της ΣΗΜΜΥ, καθώς και σε άλλα μεταπτυχιακά προγράμματα (ΑΛΜΑ, ΕΜΕ, Μαθηματική Προτυποποίηση).

    Διαλέξεις

    • Παρασκευή, 13:15-16:00, αίθ. 003, Νέο Κτ. Ηλεκτρολόγων ΕΜΠ
      (οι φοιτητές του ΑΛΜΑ θα παρακολουθούν μία πρόσθετη ώρα, 16:15-17:00)

    Έναρξη

    • 14/02/2025

    Διδάσκοντες


    Βιβλιογραφία



  • 1η διάλεξη

    Διάλεξη 14/2

    • 2η Διάλεξη

      Διάλεξη 21/2

      Data Mining I

      • Εξόρυξη κανόνων συσχέτισης και συνόλων στοιχείων που εμφανίζονται συχνά σε μεγάλα δεδομένα. 
      • Αλγόριθμος A-priori και FP-Growth. 

      Διαφάνειες

      Προτεινόμενη μελέτη: [MMDS] κεφ. 6 (link) (ενότητες 6.1, 6.2). 
      Συμπληρωματικά: [TSKK] κεφ. 6 (link) (ενότητες 6.1, 6.2).

      • 3η διάλεξη

        Διάλεξη 10/3

        Data Mining II

        Προτεινόμενη μελέτη: [MMDS] κεφ. 6 (link) [ενότητες 6.3, 6.4].

        Δείτε ακόμη: [TSKK] κεφ. 6 (link) (ενότητα 6.5).

        • 4η Διάλεξη

          Διάλεξη 14/3

          Data Mining III

          Προτεινόμενη μελέτη: [MMDS] κεφ. 6 (link) [ενότητες 6.3, 6.4].

          Δείτε ακόμη: [TSKK] κεφ. 6 (link) (ενότητα 6.5).


          Κατακερματισμός (hashing) I

          (διαφάνειες U. Zwick [1-19] από μάθημα Advanced Algorithms, Tel Aviv University): 

          • Κλειστή και ανοιχτή διευθυνσιοδότηση. Universal hash families. Αλυσίδωση.
          • Παράγοντας φόρτου και επίδρασή του στον χρόνο εκτέλεσης.
          Προτεινόμενη μελέτη: σημειώσεις (και αναφορές που περιέχονται).

          • 5η Διάλεξη

            Διάλεξη 21/3

            Κατακερματισμός (hashing) II

            (διαφάνειες U. Zwick [20-54] από μάθημα Advanced Algorithms, Tel Aviv University): 

            • Επιθυμητές ιδιότητες. Καθολικότητα και k-ανεξαρτησία. Carter-Wegman Universal hash family. 
            • Ανάλυση χρόνου βασικών πράξεων στην κλειστή και ανοιχτή διεθυνσιοδότηση.
            • Μέθοδοι διερεύνησης στην ανοιχτή διευθυνσιοδότηση: γραμμική, τετραγωνική, διπλός κατακερματισμός.
            • Τέλειος κατακερματισμός (perfect hashing). Κατακερματισμός κούκου (Cuckoo hashing). 

            Προτεινόμενη μελέτη: σημειώσεις (και αναφορές που περιέχονται).

            • 6η Διάλεξη

              Διάλεξη 28/3

              Σύντομη επισκόπηση του clustering

              Clustering Techniques, The curse of dimensionality, Hierarchical clustering, K-means(Διαφάνειες, 1-31).

              Προτεινόμενη μελέτη: [MMDS] Ενότητες: 7.1, 7.2, 7.3.
              Περαιτέρω μελέτη:      [TSKK]  Κεφάλαιο 7

              • 7η Διάλεξη

                Διάλεξη 4/4

                Σύντομη επισκόπηση του clustering

                Recommendation Systems I

                • The long Tail, Utility Matrix, Content Based Recommendation Systems, Item Profile, User Profile.

                    

                Προτεινόμενη μελέτη: [MMDS] Κεφάλαιο: 9 

                • 8η Διάλεξη

                  Διάλεξη 11/4

                  Recommendation Systems II

                  Collaborative Filtering, Finding Similar Users, Rating prediction, User - User , Item - Item

                  Hybrid Methods, Combining Global Baseline estimate and Collaborative Filtering

                      

                       Προτεινόμενη μελέτη: [MMDS] Κεφάλαιο: 9

                  • 9η Διάλεξη

                    Διάλεξη 2/5

                    Community Detection Ι

                    • Εισαγωγή σε community detection. Edge Betweeness και Modularity 
                    • Αλγόριθμος Girvan-Newman
                         Διαφάνειες (1-23)

                         Προτεινόμενη μελέτη: [MMDS] 10.1 και 10.2

                    • Αλγόριθμος Louvain

                         Διαφάνειες (27-37)

                         Προτεινόμενη μελέτη: σχετικό paper


                    • Trawling (Frequent itemsets based community detection)

                         Διαφάνειες (57-64)