Μέθοδοι Στατιστικής και Επιστήμης των Δεδομένων

Εισαγωγή

Το επιμορφωτικό Πρόγραμμα «Μέθοδοι Στατιστικής και Επιστήμης των Δεδομένων» διαρθρώνεται σε δύο αυτοτελείς  διδακτικές/ θεματικές ενότητες, διάρκειας τριών και δύο μηνών αντίστοιχα. Η Επιστήμη των Δεδομένων έχει αναδειχθεί τα τελευταία χρόνια ως ένα πολύ σημαντικό επιστημονικό πεδίο που έχει ως αντικείμενο την κατανόηση πολύπλοκων συστημάτων και την καθοδήγηση στη λήψη αποφάσεων μέσω της ανάλυσης δεδομένων. Συνθέτει στοιχεία από πολλούς άλλους βασικούς επιστημονικούς κλάδους όπως η πληροφορική, η επιστήμη των υπολογιστών, η στατιστική και η τεχνητή νοημοσύνη. Η διαδικασία που ακολουθείται σε μια εφαρμογή της Επιστήμης των Δεδομένων ξεκινά από ένα ερώτημα που θέλουμε να απαντήσουμε. Στη συνέχεια πρέπει να προσδιοριστούν οι τύποι των δεδομένων που θα μας βοηθούσαν στην απάντηση αυτού του ερωτήματος, καθώς και η διαθεσιμότητά τους. Έχοντας τα δεδομένα διαθέσιμα, θα πρέπει αρχικά να απεικονιστούν και να γίνει μια πρώτη προσπάθεια αναγνώρισης μοτίβων. Το επόμενο στάδιο αφορά στην κατασκευή του κατάλληλου υποδείγματος και στο ταίριασμα (ή εκτίμηση των παραμέτρων του) στα δεδομένα. Στο τελικό στάδιο, τα αποτελέσματα της ανάλυσης θα πρέπει να παρουσιαστούν με τον κατάλληλο τρόπο (οπτικοποίηση) ώστε να αναδεικνύονται τα κεντρικά συμπεράσματα.

Σε αυτό το σεμινάριο ξεκινάμε με μια εισαγωγή στις βασικές έννοιες της Επιστήμης των Δεδομένων. Στη συνέχεια εμβαθύνουμε στα στατιστικά εργαλεία, στον προγραμματισμό και σε ορισμένα βασικά θέματα τεχνητής νοημοσύνης. Στο πλαίσιο του σεμιναρίου ο φοιτητής έρχεται σε μια πρώτη επαφή με τις γλώσσες προγραμματισμού R και SQL. Σκοπός του προγράμματος είναι επίσης η παρουσίαση, επεξεργασία, ανάλυση διαφορετικής φύσεως δεδομένων που εφαρμόζονται σε όλες τις επιστήμες και επιστημονική τεκμηρίωση αποτελεσμάτων.

Αναλυτικά οι εκπαιδευτικοί στόχοι του προγράμματος είναι οι εξής:

  • Γνώση των κυριότερων χαρακτηριστικών της επιστήμης των δεδομένων
  • Γνώση της γλώσσας R και των εργαλείων που προσφέρει για εφαρμογές στην επιστήμη των δεδομένων
  • Γνώση μεθόδων χειρισμού, οργάνωσης και επεξεργασίας ψηφιακών δεδομένων με τη γλώσσα R.
  • Εισαγωγή στη Μηχανική Μάθηση, στα είδη μηχανικής μάθησης και γνώση των βασικών αλγορίθμων με εφαρμογές στην R
  • Εισαγωγική γνώση των βάσεων δεδομένων και εφαρμογές με τις γλώσσες R και SQL.
  • Γνώση των βασικών μεθόδων στατιστικής ανάλυσης δεδομένων με τη χρήση της R
  • Αποτύπωση Περιγραφικής στατιστικής
  • Χρήση σωστού τεστ για ανάλυση δεδομένων ανάλογα με τη φύση τους
  • Χρήση τεστ για Πρoβλέψεις
  • Επιστημονική συμπερασματολογία από την ανάλυση των στοιχείων

Επιμέρους Διδακτικές Ενότητες

Ι. Εισαγωγή στην Επιστήμη των Δεδομένων-Introduction to Data Science (Διάρκεια 3 μήνες/ 80 ώρες/ 3,08 ECTS)

ΙΙ. Εφαρμογές Περιγραφικής Στατιστικής σε Περιβάλλον SPSS (Διάρκεια 2 μήνες/ 50 ώρες/ 1,92 ECTS)