Weekly outline

  • Ακαδημαϊκό Έτος 2024-2025

    Το μάθημα προσφέρεται στους σπουδαστές του ΔΠΜΣ "Επιστήμη Δεδομένων και Μηχανική Μάθηση", στους Υ.Δ. της ΣΗΜΜΥ, καθώς και σε άλλα μεταπτυχιακά προγράμματα (ΑΛΜΑ, ΕΜΕ, Μαθηματική Προτυποποίηση).

    Διαλέξεις

    • Παρασκευή, 13:15-16:00, αίθ. 003, Νέο Κτ. Ηλεκτρολόγων ΕΜΠ
      (οι φοιτητές του ΑΛΜΑ θα παρακολουθούν μία πρόσθετη ώρα, 16:15-17:00)

    Έναρξη

    • 14/02/2025

    Διδάσκοντες


    Βιβλιογραφία



  • 1η διάλεξη

    Διάλεξη 14/2

    • 2η Διάλεξη

      Διάλεξη 21/2

      Data Mining I

      • Εξόρυξη κανόνων συσχέτισης και συνόλων στοιχείων που εμφανίζονται συχνά σε μεγάλα δεδομένα. 
      • Αλγόριθμος A-priori και FP-Growth. 

      Διαφάνειες

      Προτεινόμενη μελέτη: [MMDS] κεφ. 6 (link) (ενότητες 6.1, 6.2). 
      Συμπληρωματικά: [TSKK] κεφ. 6 (link) (ενότητες 6.1, 6.2).

      • 3η διάλεξη

        Διάλεξη 10/3

        Data Mining II

        Προτεινόμενη μελέτη: [MMDS] κεφ. 6 (link) [ενότητες 6.3, 6.4].

        Δείτε ακόμη: [TSKK] κεφ. 6 (link) (ενότητα 6.5).

        • 4η Διάλεξη

          Διάλεξη 14/3

          Data Mining III

          Προτεινόμενη μελέτη: [MMDS] κεφ. 6 (link) [ενότητες 6.3, 6.4].

          Δείτε ακόμη: [TSKK] κεφ. 6 (link) (ενότητα 6.5).


          Κατακερματισμός (hashing) I

          (διαφάνειες U. Zwick [1-19] από μάθημα Advanced Algorithms, Tel Aviv University): 

          • Κλειστή και ανοιχτή διευθυνσιοδότηση. Universal hash families. Αλυσίδωση.
          • Παράγοντας φόρτου και επίδρασή του στον χρόνο εκτέλεσης.
          Προτεινόμενη μελέτη: σημειώσεις (και αναφορές που περιέχονται).

          • 5η Διάλεξη

            Διάλεξη 21/3

            Κατακερματισμός (hashing) II

            (διαφάνειες U. Zwick [20-54] από μάθημα Advanced Algorithms, Tel Aviv University): 

            • Επιθυμητές ιδιότητες. Καθολικότητα και k-ανεξαρτησία. Carter-Wegman Universal hash family. 
            • Ανάλυση χρόνου βασικών πράξεων στην κλειστή και ανοιχτή διεθυνσιοδότηση.
            • Μέθοδοι διερεύνησης στην ανοιχτή διευθυνσιοδότηση: γραμμική, τετραγωνική, διπλός κατακερματισμός.
            • Τέλειος κατακερματισμός (perfect hashing). Κατακερματισμός κούκου (Cuckoo hashing). 

            Προτεινόμενη μελέτη: σημειώσεις (και αναφορές που περιέχονται).

            • 6η Διάλεξη

              Διάλεξη 28/3

              Σύντομη επισκόπηση του clustering

              Clustering Techniques, The curse of dimensionality, Hierarchical clustering, K-means(Διαφάνειες, 1-31).

              Προτεινόμενη μελέτη: [MMDS] Ενότητες: 7.1, 7.2, 7.3.
              Περαιτέρω μελέτη:      [TSKK]  Κεφάλαιο 7

              • 7η Διάλεξη

                Διάλεξη 4/4

                Σύντομη επισκόπηση του clustering

                Recommendation Systems I

                • The long Tail, Utility Matrix, Content Based Recommendation Systems, Item Profile, User Profile.

                    

                Προτεινόμενη μελέτη: [MMDS] Κεφάλαιο: 9 

                • 8η Διάλεξη

                  Διάλεξη 11/4

                  Recommendation Systems II

                  Collaborative Filtering, Finding Similar Users, Rating prediction, User - User , Item - Item

                  Hybrid Methods, Combining Global Baseline estimate and Collaborative Filtering

                      

                       Προτεινόμενη μελέτη: [MMDS] Κεφάλαιο: 9

                  • 9η Διάλεξη

                    Διάλεξη 2/5

                    Community Detection Ι

                    • Εισαγωγή σε community detection. Edge Betweeness και Modularity 
                    • Αλγόριθμος Girvan-Newman
                         Διαφάνειες (1-23)

                         Προτεινόμενη μελέτη: [MMDS] 10.1 και 10.2

                    • Αλγόριθμος Louvain

                         Διαφάνειες (27-37)

                         Προτεινόμενη μελέτη: σχετικό paper


                    • Trawling (Frequent itemsets based community detection)

                         Διαφάνειες (57-64)

                    • 10η Διάλεξη

                      Διάλεξη 9/5

                      Community Detection II

                      • Εντοπισμός κοινοτήτων μέσω ιδιοτιμών γράφων, spectral clustering. 
                           Διαφάνειες (24-56, οι διαφ. 44-47 συνοπτικά).
                           Προτεινόμενη μελέτη: [MMDS] 10.4


                      • Εντοπισμός επικαλυπτόμενων κοινοτήτων με μεγιστοποίηση πιθανοφάνειας (MLE). Αλγόριθμος BigCLAM.
                           Διαφάνειες
                           Προτεινόμενη μελέτη: [MMDS]  10.5


                      • 11η Διάλεξη

                        Διάλεξη 16/05/2025

                        Link Analysis

                        Definition of Page Rank, Structure of the Web 

                        Power Iteration method, Avoiding Dead Ends, Spider Traps and Taxation Efficient Computation of Page Rank, Efficient Approaches to Page Rank Iteration 

                        Διαφάνειες, 1-46

                        Προτεινόμενη μελέτη: [MMDS] Κεφάλαιο: 5



                        • 12η Διάλεξη

                          Διάλεξη 23/5

                          Link Analysis

                          Random Teleports, Computing Page Rank (Matrix Formulation, Rearranging the Equation, Sparse Matrix Formulation and Enconding, Block stripe Analysis)  

                          Διαφάνειες, 46-60

                          Topic Specific Page Rank,  Measuring Proximity in Graphs (Διαφάνειες 6-35)

                          Προτεινόμενη μελέτη: [MMDS] Κεφάλαιο 5

                          Advertising on the web  

                                Adwords problem, the Balance Algorithm                                                                      

                                Διαφάνειες (1-32)

                                Προτεινόμενη μελέτη: [MMDS] Κεφάλαιο 8