Οι ερευνητές της Σχολής Μηχανικής και Εφαρμοσμένων Επιστημών του University of Virginia έχουν πάει ένα βήμα παραπέρα τις δυνατότητες οπτικών δεδομένων της Τεχνητής Νοημοσύνης με την τελευταία τους καινοτομία – έναν αναλυτή βίντεο που βασίζεται στην AI και ονομάζεται Semantic and Motion-Aware Spatiotemporal Transformer Network (SMAST). Το σύστημα αυτό προσφέρει ακρίβεια στην ανίχνευση ανθρώπινων ενεργειών, υποσχόμενο εφαρμογές σε τομείς όπως η δημόσια ασφάλεια, η παρακολούθηση κινήσεων, ακόμη και η αυτόνομη πλοήγηση οχημάτων.
Στο επίκεντρο των δυνατοτήτων του SMAST βρίσκεται η ικανότητά του να επεξεργάζεται πολύπλοκο υλικό βίντεο εστιάζοντας στα πιο σημαντικά μέρη μιας σκηνής. Το σύστημα ενσωματώνει ένα μοντέλο επιλεκτικής προσοχής πολλαπλών χαρακτηριστικών και έναν αλγόριθμο κωδικοποίησης θέσης 2D με επίγνωση της κίνησης. Αυτά τα χαρακτηριστικά συνεργάζονται για να διασφαλίσουν ότι η Τεχνητή Νοημοσύνη μπορεί να ανιχνεύει και να ερμηνεύει με ακρίβεια τις ανθρώπινες ενέργειες.
Το μοντέλο επιλεκτικής προσοχής επιτρέπει στο SMAST να εστιάζει σε κρίσιμα στοιχεία, όπως ένα άτομο ή ένα αντικείμενο σε κίνηση, αγνοώντας άσχετες λεπτομέρειες. Για παράδειγμα, μπορεί να διακρίνει κάποιον που πετάει μια μπάλα από κάποιον που απλώς σηκώνει το χέρι του.
Παράλληλα, ο αλγόριθμος που έχει επίγνωση της κίνησης επιτρέπει στην τεχνητή νοημοσύνη να παρακολουθεί τις κινήσεις με την πάροδο του χρόνου, θυμούμενη πώς έχουν μετατοπιστεί τα αντικείμενα και οι άνθρωποι μέσα σε μια σκηνή. Αυτό δίνει στο SMAST την ικανότητα να κατανοεί τις σχέσεις μεταξύ διαφορετικών ενεργειών, καθιστώντας το πιο αποτελεσματικό στην αναγνώριση σύνθετων συμπεριφορών.
Στους τομείς της ασφάλειας και της επιτήρησης, το σύστημα SMAST μπορεί να ενισχύσει τη δημόσια ασφάλεια με την ανίχνευση πιθανών απειλών σε πραγματικό χρόνο. Για παράδειγμα, μπορεί να εντοπίσει ύποπτη συμπεριφορά σε έναν χώρο με πολύ κόσμο ή να αναγνωρίσει αν κάποιος βρίσκεται σε κίνδυνο. Στον τομέα της υγειονομικής περίθαλψης, η τεχνολογία θα μπορούσε να χρησιμοποιηθεί για την παρακολούθηση των κινήσεων των ασθενών, επιτρέποντας την καλύτερη ανάλυση της κίνησης για την αποκατάσταση ή την παρακολούθηση κατά τη διάρκεια της χειρουργικής επέμβασης.
Οι ερευνητές υποστηρίζουν ότι το SMAST ξεχωρίζει για την ικανότητά του να χειρίζεται χαοτικό, μη επεξεργασμένο υλικό. Η προσέγγιση του SMAST με βάση την τεχνητή νοημοσύνη προφανώς του επιτρέπει να μαθαίνει από τα δεδομένα, να προσαρμόζεται σε διάφορα περιβάλλοντα και να βελτιώνει τις ικανότητές του στην ανίχνευση ενεργειών. Το εργαλείο έχει υποβληθεί σε διάφορα ακαδημαϊκά benchmarks, συμπεριλαμβανομένων των AVA, UCF101-24 και EPIC-Kitchens και τα πήγε αρκετά καλά.
«Αυτή η AI τεχνολογία ανοίγει πόρτες για την ανίχνευση δράσης σε πραγματικό χρόνο σε μερικά από τα πιο απαιτητικά περιβάλλοντα», δήλωσε ο καθηγητής και πρόεδρος του Τμήματος Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, Scott T. Acton. «Είναι το είδος της προόδου που μπορεί να βοηθήσει στην πρόληψη ατυχημάτων, στη βελτίωση της διάγνωσης και ακόμη και στη διάσωση ζωών».