Το νέο θεμελιώδες μοντέλο της IBM και του Ευρωπαϊκού Οργανισμού Διαστήματος (ESA) συνδυάζει δεδομένα από εννέα διαφορετικούς τύπους παρατήρησης της Γης, προσφέροντας μια κατανοητή επισκόπηση του πλανήτη
Τι είδους πληροφορίες θα χρειαζόταν ένα μοντέλο τεχνητής νοημοσύνης για να κατανοήσει πραγματικά τον πλανήτη μας; Αυτό ήταν το ερώτημα που επιχείρησαν να απαντήσουν φέτος ερευνητές από την IBM, τον Ευρωπαϊκό Οργανισμό Διαστήματος (ESA), την KP Labs, το Jülich Supercomputing Center (JSC) και τη Γερμανική Διαστημική Υπηρεσία (DLR), στο πλαίσιο μιας πρωτοβουλίας υπό την ηγεσία του ESA με στόχο τη βελτίωση της πρόσβασης σε θεμελιώδη μοντέλα τεχνητής νοημοσύνης για την κοινότητα της παρατήρησης της Γης.
Γι’ αυτόν τον λόγο, η IBM και ο ESA ανακοίνωσαν σήμερα το TerraMind — ένα νέο μοντέλο παρατήρησης της Γης, το οποίο διαθέτουν ως λογισμικό ανοιχτού κώδικα στην πλατφόρμα Hugging Face. Το μοντέλο έχει προ-εκπαιδευτεί πάνω στο TerraMesh — το μεγαλύτερο γεωχωρικό σύνολο δεδομένων που είναι σήμερα διαθέσιμο — το οποίο δημιουργήθηκε από την ερευνητική ομάδα στο πλαίσιο του έργου TerraMind.
Ηγετική θέση στην απόδοση μοντέλων γεωχωρικής ανάλυσης
Το TerraMind διαθέτει μια μοναδική συμμετρική αρχιτεκτονική encoder-decoder βασισμένη σε μετασχηματιστές (transformers), σχεδιασμένη να επεξεργάζεται είσοδο τύπου εικονοστοιχείου (pixel-based), συμβόλου (token-based) και ακολουθίας (sequence-based), μαθαίνοντας συσχετισμούς μεταξύ διαφορετικών μορφών δεδομένων. Παρά το γεγονός ότι έχει εκπαιδευτεί σε περισσότερα από 500 δισεκατομμύρια tokens, το TerraMind παραμένει ένα μικρό και ελαφρύ μοντέλο, απαιτώντας δέκα φορές λιγότερους υπολογιστικούς πόρους σε σχέση με τη χρήση ξεχωριστών μοντέλων ανά μορφή δεδομένων. Αυτό σημαίνει πως οι χρήστες μπορούν να το αναπτύξουν σε μεγάλη κλίμακα με χαμηλότερο κόστος, μειώνοντας ταυτόχρονα τη συνολική κατανάλωση ενέργειας κατά την εκτέλεση (inference).
«Αυτό που ξεχωρίζει το TerraMind, κατά τη γνώμη μου, είναι ότι δεν περιορίζεται απλώς στην επεξεργασία δεδομένων παρατήρησης της Γης μέσω αλγορίθμων υπολογιστικής όρασης. Διαθέτει μια διαισθητική κατανόηση των γεωχωρικών δεδομένων και του πλανήτη μας», δήλωσε ο Juan Bernabé-Moreno, Διευθυντής του IBM Research για το Ηνωμένο Βασίλειο και την Ιρλανδία, καθώς και επικεφαλής του προγράμματος IBM Accelerated Discovery για το κλίμα και τη βιωσιμότητα. «Αυτή τη στιγμή, το TerraMind αποτελεί το πιο αποδοτικό θεμελιώδες μοντέλο τεχνητής νοημοσύνης για την παρατήρηση της Γης, βάσει καθιερωμένων δεικτών αξιολόγησης της ερευνητικής κοινότητας,» πρόσθεσε ο Bernabé-Moreno.
Σε αξιολόγηση του ESA, το TerraMind συγκρίθηκε με 12 δημοφιλή θεμελιώδη μοντέλα τεχνητής νοημοσύνης για παρατήρηση της Γης, χρησιμοποιώντας το PANGAEA — έναν καθιερωμένο δείκτη αξιολόγησης της ερευνητικής κοινότητας — προκειμένου να μετρηθεί η απόδοση των μοντέλων σε πραγματικές εφαρμογές, όπως η ταξινόμηση κάλυψης εδάφους, η ανίχνευση αλλαγών, η περιβαλλοντική παρακολούθηση και η ανάλυση δεδομένων από πολλαπλούς αισθητήρες και χρονικές περιόδους. Τα αποτελέσματα του δείκτη αξιολόγησης έδειξαν ότι το TerraMind ξεπέρασε τα υπόλοιπα μοντέλα στις παραπάνω εργασίες με διαφορά που ξεπερνά το 8%.
«Το TerraMind συνδυάζει πληροφορίες από πολλαπλές μορφές δεδομένων εκπαίδευσης, ενισχύοντας την ακρίβεια των αποτελεσμάτων του,» δήλωσε η Simonetta Cheli, Διευθύντρια των Προγραμμάτων Παρατήρησης της Γης της ESA και Επικεφαλής του ESRIN. «Η ικανότητά του να ενσωματώνει με διαισθητικό τρόπο συμφραζόμενες πληροφορίες και να δημιουργεί σενάρια που δεν έχουν παρατηρηθεί προηγουμένως, αποτελεί κρίσιμο βήμα για την πλήρη αξιοποίηση της αξίας των δεδομένων της ESA. Σε σύγκριση με ανταγωνιστικά μοντέλα, το TerraMind μπορεί να προσφέρει βαθύτερη κατανόηση του πλανήτη — τόσο για την ερευνητική κοινότητα όσο και για τον επιχειρηματικό κόσμο.»
Στην πράξη, για να προβλέψει κανείς τον κίνδυνο λειψυδρίας, είναι απαραίτητο να ληφθούν υπόψη πολλοί διαφορετικοί παράγοντες όπως η χρήση γης, το κλίμα, η βλάστηση, οι γεωργικές δραστηριότητες και η γεωγραφική θέση. Πριν από το TerraMind, όλα αυτά τα δεδομένα ήταν απομονωμένα σε ξεχωριστές πηγές. Η ενοποίηση αυτών των πληροφοριών επιτρέπει στους χρήστες να προβλέπουν τον ενδεχόμενο κίνδυνο λειψυδρίας, βασιζόμενοι σε μια πιο ευρεία και ακριβή εικόνα των συνθηκών στον πλανήτη.
Εννέα εκατομμύρια σημεία δεδομένων, εννέα διαφορετικές μορφές πληροφορίας
Κατά τη δημιουργία του συνόλου δεδομένων, οι ερευνητές ενσωμάτωσαν πληροφορίες από όλα τα βιοκλίματα, τους τύπους χρήσης και κάλυψης γης, καθώς και από όλες τις γεωγραφικές περιοχές επιτρέποντας στο μοντέλο να εφαρμόζεται εξίσου αποτελεσματικά σε κάθε περίπτωση χρήσης παγκοσμίως, περιορίζοντας την παρουσία μεροληψίας.
Το σύνολο δεδομένων περιλαμβάνει 9 εκατομμύρια δείγματα δεδομένων, κατανεμημένα παγκοσμίως και ευθυγραμμισμένα χωρικά και χρονικά, καλύπτοντας εννέα βασικές μορφές πληροφορίας, μεταξύ αυτών περιλαμβάνονται παρατηρήσεις από δορυφορικούς αισθητήρες, η γεωμορφολογία της επιφάνειας της Γης, χαρακτηριστικά επιφάνειας κρίσιμα για τη ζωή στον πλανήτη (όπως η βλάστηση και η χρήση γης), καθώς και βασικά στοιχεία περιγραφής τοποθεσιών και χαρακτηριστικών (γεωγραφικό πλάτος και μήκος, και απλοποιημένες περιγραφές σε μορφή κειμένου).
Αυτορρυθμιζόμενο μοντέλο για τη δημιουργία τεχνητών δεδομένων
Από τεχνική άποψη, το TerraMind είναι καινοτόμο ακόμα και πέρα από τον τομέα της παρατήρησης της Γης. Είναι το πρώτο “any-to-any” πολυδιάστατο γενετικό μοντέλο τεχνητής νοημοσύνης για την παρατήρηση της Γης. Αυτό σημαίνει ότι μπορεί να δημιουργεί αυτόματα επιπλέον δεδομένα εκπαίδευσης από άλλες μορφές δεδομένων — μια τεχνική που οι ερευνητές της IBM ονόμασαν ρύθμιση “Thinking-in-Modalities” (TiM). Το TiM είναι μια νέα προσέγγιση για τα μοντέλα υπολογιστικής όρασης, παρόμοια με την αλυσίδα σκέψης (chain-of-thought) στα γλωσσικά μοντέλα. Εμπειρικές αποδείξεις δείχνουν ότι η ρύθμιση TiM μπορεί να ενισχύσει την απόδοση του μοντέλου πέρα από τη συνήθη ρύθμιση (fine-tuning).
«Η ρύθμιση TiM ενισχύει την αποδοτικότητα των δεδομένων δημιουργώντας αυτόματα επιπλέον δεδομένα εκπαίδευσης που σχετίζονται με το πρόβλημα που αντιμετωπίζεται — για παράδειγμα, δίνοντας εντολή στο μοντέλο να “σκεφτεί” για την κάλυψη του εδάφους όταν χαρτογραφεί υδάτινα σώματα. Αυτή η καινοτομία μπορεί να επιτρέψει την επίτευξη αξεπέραστης ακρίβειας κατά την εξειδίκευση του TerraMind για συγκεκριμένες εφαρμογές»,δήλωσε ο Johannes Jakubik, επιστημονικό μέλος της ομάδας του IBM Research με έδρα τη Ζυρίχη.
Βασισμένο σε ένα γερό θεμέλιο
Η εφαρμογή τεχνικών τεχνητής νοημοσύνης και μηχανικής μάθησης σε δεδομένα που σχετίζονται με τη Γη, συμπεριλαμβανομένων δορυφόρων και προτύπων χρήσης γης, δεν είναι κάτι καινούργιο. Υπάρχοντα γεωχωρικά μοντέλα βάσης, όπως αυτά που έχουν αναπτυχθεί από την IBM και τη NASA, επιτρέπουν στους επιστήμονες να κατανοούν αυτά τα δεδομένα — βοηθώντας τους να αντιμετωπίσουν καλύτερα περιπτώσεις χρήσης σε τομείς όπως η γεωργία υψηλής ακρίβειας, η διαχείριση φυσικών καταστροφών, η παρακολούθηση του περιβάλλοντος (μέσω νερού, θερμότητας και ξηρασίας), ο αστικός και περιφερειακός σχεδιασμός, η παρακολούθηση κρίσιμων υποδομών, η δασοπονία και η παρακολούθηση της βιοποικιλότητας, και άλλα.
Ωστόσο, τα υπάρχοντα μοντέλα επεξεργάζονται δεδομένα από πηγές που, κατά καιρούς, δεν μπορούν να αποτυπώσουν την πλούσια πραγματικότητα των συνθηκών στον πλανήτη μας. Ενώ οι δορυφόροι περιστρέφονται γύρω από τη Γη, παρέχοντας δεδομένα με χρονική κλιμάκωση για φυσικά φαινόμενα, επισκέπτονται την ίδια τοποθεσία κάθε πέντε ημέρες. Για την ανάλυση κλιματικών φαινομένων σε μακροπρόθεσμο επίπεδο, αυτά τα δεδομένα είναι αρκετά για να προβλέψουν και να αναθεωρήσουν τάσεις. Όταν παρακολουθούμε βραχυπρόθεσμα γεγονότα, όπως πυρκαγιές και πλημμύρες, κάθε μέρα μετράει και οι ερευνητές χρειάζονται τα πιο πρόσφατα δεδομένα για να κάνουν προβλέψεις ή να εκτιμήσουν τον κίνδυνο χρησιμοποιώντας μοντέλα τεχνητής νοημοσύνης.
Για να λύσουν αυτή την πρόκληση, οι ερευνητές της IBM συνδύασαν τις τεχνικές τους γνώσεις στην προετοιμασία δεδομένων και την ανάπτυξη μοντέλων βάσης με τα πολύτιμα δεδομένα παρατήρησης της Γης από την ESA και την εξειδίκευση στην αξιολόγηση μοντέλων, για να αναπτύξουν ένα νέο πολυδιάστατο μοντέλο βάσης τεχνητής νοημοσύνης για την παρατήρηση της Γης. Εκπαιδεύτηκε χρησιμοποιώντας την υποδομή και την εξειδίκευση του Κέντρου Υπερυπολογιστών Jülich. Άλλοι συνεργάτες συνέβαλαν στη συνολική διαδικασία ανάπτυξης του μοντέλου, διεξάγοντας πειράματα κλίμακας και προετοιμάζοντας εφαρμογές κατά κλίμακα (downscaling).
Μια συνεχής προσπάθεια
Το TerraMind αποτελεί μέρος της προσπάθειας της IBM να χρησιμοποιήσει την τεχνολογία τεχνητής νοημοσύνης για να εξερευνήσει τον πλανήτη μας. Αυτή τη στιγμή, κυβερνήσεις, εταιρείες και δημόσιοι οργανισμοί χρησιμοποιούν τα μοντέλα Prithvi της IBM-NASA και ταεξειδικευμένα γεωχωρικά μοντέλα IBM Granite για να εξετάσουν τις αλλαγές στα πρότυπα καταστροφών, τη βιοποικιλότητα και τη χρήση γης, καθώς και για την ανίχνευση και πρόβλεψη ακραίων καιρικών φαινομένων. Ειδικοί από τη NASA συμμετείχαν επίσης στην επικύρωση του TerraMind, στο πλαίσιο της πρωτοβουλίας Ανοιχτής Επιστήμης της NASA. Όλα τα γεωχωρικά μοντέλα είναι διαθέσιμα στο Hugging Face και στο IBM Geospatial Studio.
Οι εκδόσεις του TerraMind με τελειοποιημένη (fine-tuned) απόδοση για την αντίδραση σε καταστροφές και άλλες εφαρμογές υψηλής επίδρασης θα προστεθούν στη βάση δεδομένων IBM Granite Geospatial τον επόμενο μήνα, προκειμένου να επιτραπεί στις κοινότητες και τις επιχειρήσεις να εκμεταλλευτούν τη δύναμη αυτής της νέας γενιάς αναλυτικών εργαλείων παρατήρησης της Γης.
“Με την επιστήμη της παρατήρησης της Γης, την τεχνολογία και τη διεθνή συνεργασία, ξεκλειδώνουμε το πλήρες δυναμικό των δεδομένων που προέρχονται από το διάστημα για να προστατεύσουμε τον πλανήτη μας,” είπε ο Nicolas Longepe, Επιστήμονας Δεδομένων Παρατήρησης της Γης στην ESA.
Αυτό το έργο είναι ένα τέλειο παράδειγμα όπου η επιστημονική κοινότητα, οι μεγάλες τεχνολογικές εταιρείες και οι ειδικοί συνεργάστηκαν για να αξιοποιήσουν αυτή την τεχνολογία προς όφελος των επιστημών της Γης. Η μαγεία συμβαίνει όταν οι ειδικοί στα δεδομένα παρατήρησης της Γης, οι ειδικοί στη μηχανική μάθηση, οι επιστήμονες δεδομένων και οι μηχανικοί Υπολογιστικών Υποδομών Υψηλής Απόδοσης (HPC) συνεργάζονται.