Κορυφαίες εταιρείες τεχνητής νοημοσύνης και ερευνητικά ιδρύματα της Ευρώπης ενώνουν τις δυνάμεις και την τεχνογνωσία τους για την ανάπτυξη της επόμενης γενιάς ανοιχτού κώδικα γλωσσικών μοντέλων, σε μια συνεργασία με στόχο την ενίσχυση των δυνατοτήτων της ευρωπαϊκής τεχνητής νοημοσύνης, σε ένα έργο που φέρει την ονομασία OpenEuroLLM. Η Ευρωπαϊκή Επιτροπή απένειμε στο πολύγλωσσο έργο τεχνητής νοημοσύνης OpenEuroLLM τη σφραγίδα STEP (Strategic Technologies for Europe Platform) – την πρώτη που απονέμεται σε έργο χρηματοδοτούμενο από το πρόγραμμα Digital Europe.
Το STEP είναι μια νέα πρωτοβουλία της ΕΕ που στοχεύει στην ενίσχυση της ευρωπαϊκής βιομηχανικής ανταγωνιστικότητας μέσω της υποστήριξης κρίσιμων τεχνολογιών, συμπεριλαμβανομένης της τεχνητής νοημοσύνης. Η απονομή της «σφραγίδας» STEP αποτελεί ένα ευρωπαϊκό σήμα αριστείας, το οποίο βοηθά τα έργα να αποκτήσουν πρόσβαση σε επιπλέον ευρωπαϊκούς πόρους, ενώ παράλληλα ενισχύει το επενδυτικό τους προφίλ.
Το OpenEuroLLM αναπτύσσει την πρώτη οικογένεια ανοιχτού κώδικα Μεγάλων Γλωσσικών Μοντέλων (Large Language Models – LLMs) που θα καλύπτουν όλες τις επίσημες και μελλοντικές γλώσσες της ΕΕ. Συγκεντρώνοντας ευρωπαϊκές νεοφυείς επιχειρήσεις, ερευνητικά εργαστήρια και φορείς φιλοξενίας υπερυπολογιστών, το έργο στοχεύει στην εκπαίδευση αυτών των μοντέλων σε ευρωπαϊκούς υπερυπολογιστές, διασφαλίζοντας, παράλληλα, ότι αντανακλούν τις ευρωπαϊκές αξίες διαφάνειας, ανοικτότητας και προσβασιμότητας, σε πλήρη συμμόρφωση με τον νόμο για την τεχνητή νοημοσύνη (AI Act).
Το συνολικό προϋπολογισθέν κόστος του OpenEuroLLM ανέρχεται στα 37,4 εκατομμύρια ευρώ, εκ των οποίων τα 20,6 εκατομμύρια προέρχονται από το πρόγραμμα Digital Europe. Οι σφραγίδες STEP απονέμονται σε έργα που πληρούν τα ποιοτικά κριτήρια στις προσκλήσεις υποβολής προτάσεων υπό πέντε προγράμματα που χρηματοδοτούνται από τον προϋπολογισμό της ΕΕ, συμπεριλαμβανομένου του προγράμματος Digital Europe. Τα έργα που λαμβάνουν τη σφραγίδα προβάλλονται στο STEP portal της Ευρωπαϊκής Επιτροπής και αποκτούν ειδική σήμανση στην πύλη InvestEU.
Ένα κοινοπρακτικό σχήμα 20 κορυφαίων ευρωπαϊκών ερευνητικών ιδρυμάτων, επιχειρήσεων και κέντρων EuroHPC θα αναπτύξει μια οικογένεια υψηλής απόδοσης, πολύγλωσσων, βασικών γλωσσικών μοντέλων για εμπορικές, βιομηχανικές και δημόσιες υπηρεσίες. Τα διαφανή και συμμορφούμενα με τους κανονισμούς μοντέλα ανοιχτού κώδικα «θα δημοκρατικοποιήσουν την πρόσβαση σε τεχνολογίες τεχνητής νοημοσύνης υψηλής ποιότητας, ενισχύοντας τη δυνατότητα των ευρωπαϊκών εταιρειών να ανταγωνιστούν σε παγκόσμιο επίπεδο και των δημόσιων οργανισμών να παράγουν ουσιαστικές δημόσιες υπηρεσίες».
Το έργο OpenEuroLLM, όπως αναφέρεται στη σχετική ανακοίνωση, είναι πλήρως ευθυγραμμισμένο με την επιτακτική ανάγκη για την ενίσχυση της ανταγωνιστικότητας και της ψηφιακής κυριαρχίας της Ευρώπης. «Αποτελεί ένα πρωταρχικό παράδειγμα του είδους τεχνολογικής υποδομής που απαιτείται για τη μείωση των εμποδίων στην ανάπτυξη και τη βελτιστοποίηση προϊόντων τεχνητής νοημοσύνης στην Ευρώπη, επιδεικνύοντας τη δύναμη της διαφάνειας, της ανοικτότητας και της κοινοτικής συμμετοχής – αξίες που αναγνωρίζονται ευρέως στο ευρωπαϊκό τεχνολογικό οικοσύστημα».
Τα μοντέλα θα αναπτυχθούν στο πλαίσιο του κανονιστικού πλαισίου της Ευρώπης, διασφαλίζοντας την ευθυγράμμισή τους με τις ευρωπαϊκές αξίες, «ενώ παράλληλα θα διατηρούν τεχνολογική υπεροχή». Σε συνεργασία με κοινότητες ανοιχτού κώδικα και ανοικτής επιστήμης, όπως οι LAION, open-sci και OpenML, καθώς και με επιπλέον ειδικούς που συγκροτούν το Open Strategic Partnership Board του έργου, το OpenEuroLLM θα εξασφαλίσει ότι τα μοντέλα, το λογισμικό, τα δεδομένα και οι αξιολογήσεις θα είναι πλήρως ανοιχτά και προσαρμόσιμα στις εξειδικευμένες ανάγκες της βιομηχανίας και του δημόσιου τομέα. Τα υψηλής απόδοσης πολύγλωσσα μοντέλα διατηρούν τόσο τη γλωσσική όσο και την πολιτιστική ποικιλομορφία, δίνοντας τη δυνατότητα στις ευρωπαϊκές εταιρείες να αναπτύξουν ποιοτικά προϊόντα και υπηρεσίες στην εποχή της τεχνητής νοημοσύνης.
Το έργο αξιοποιεί την υποστήριξη προηγούμενων ευρωπαϊκών έργων και την εμπειρία των εταίρων και των αποτελεσμάτων τους, συμπεριλαμβανομένων μεγάλων αποθετηρίων υψηλής ποιότητας δεδομένων και πιλοτικών LLMs που έχουν αναπτυχθεί στο παρελθόν. Η κοινοπραξία ξεκίνησε το έργο της την 1η Φεβρουαρίου 2025, με χρηματοδότηση από την Ευρωπαϊκή Επιτροπή στο πλαίσιο του προγράμματος Digital Europe.