Γενική θεώρηση




Παρά την αξιοσημείωτη πρόοδο που έχει επιτευχθεί, ιδιαίτερα με τις μεθοδολογίες βαθιάς μάθησης κατά την τελευταία δεκαετία, η σε βάθος κατανόηση βίντεο παραμένει μια πρόκληση. Το έργο eXeLMM θα αντιμετωπίσει αυτή την πρόκληση αξιοποιώντας την αναδυόμενη τεχνολογία των Μεγάλων Γλωσσικών Μοντέλων (ΜΓΜ) / Μεγάλων Πολυτροπικών Μοντέλων (ΜΠΜ). Ισχυρά και ανοιχτά τέτοια μοντέλα θα επιλεγούν από την πλέον πρόσφατη βιβλιογραφία, θα προσαρμοστούν και θα χρησιμοποιηθούν για τη σε βάθος κατανόηση βίντεο. Στα πλαίσια αυτής της προσπάθειας, το eXeLMM θα συμβάλει στην αντιμετώπιση κρίσιμων ζητημάτων που προκύπτουν όταν επιχειρεί κανείς να αξιοποιήσει ΜΓΜ / ΜΠΜ σε προβλήματα κατανόησης βίντεο, όπως η υπολογιστική αποδοτικότητα και η εξηγησιμότητα.