Η Google παρουσίασε το νεότερο μοντέλο τεχνητής νοημοσύνης της, το Gemini 3. Το νέο μοντέλο ΤΝ θα επιτρέψει στους χρήστες να λαμβάνουν καλύτερες απαντήσεις σε πιο σύνθετα ερωτήματα, «ώστε να λαμβάνετε αυτό που χρειάζεστε με λιγότερες εντολές», δήλωσε ο διευθύνων σύμβουλος της Alphabet, Sundar Pichai. Το Gemini 3 θα ενσωματωθεί στην εφαρμογή Gemini, στα προϊόντα αναζήτησης τεχνητής νοημοσύνης της Google, AI Mode και AI Overviews, καθώς και στα εταιρικά της προϊόντα. Η διάθεση ξεκινά την Τρίτη για επιλεγμένους συνδρομητές και θα επεκταθεί ευρύτερα τις επόμενες εβδομάδες. Η ανακοίνωση έρχεται περίπου οκτώ μήνες μετά την παρουσίαση του Gemini 2.5 και 11 μήνες μετά το Gemini 2.0, ενώ η OpenAI, η οποία πυροδότησε την έκρηξη της παραγωγικής ΤΝ στα τέλη του 2022 με τη δημόσια κυκλοφορία του ChatGPT, παρουσίασε το GPT-5 τον Αύγουστο.
Ο Pichai έγραψε πως «είναι εκπληκτικό να σκεφτεί κανείς ότι σε μόλις δύο χρόνια, η ΤΝ έχει εξελιχθεί από την απλή ανάγνωση κειμένου και εικόνων στο να αντιλαμβάνεται το κλίμα», προσθέτοντας χαρακτηριστικά: «Από σήμερα, διαθέτουμε το Gemini στην κλίμακα της Google». Η εταιρεία ανέφερε ότι η εφαρμογή Gemini διαθέτει πλέον 650 εκατομμύρια μηνιαίους ενεργούς χρήστες και το AI Overviews έχει 2 δισεκατομμύρια μηνιαίους χρήστες, τη στιγμή που η OpenAI δήλωσε τον Αύγουστο ότι το ChatGPT έφτασε τους 700 εκατομμύρια εβδομαδιαίους χρήστες. Ο Pichai πρόσθεσε ότι το νεότερο μοντέλο είναι «κατασκευασμένο για να αντιλαμβάνεται το βάθος και τις λεπτές αποχρώσεις» και δήλωσε ότι το Gemini 3 είναι επίσης «πολύ καλύτερο στο να κατανοεί το πλαίσιο και την πρόθεση πίσω από το αίτημά σας, ώστε να λαμβάνετε αυτό που χρειάζεστε με λιγότερες εντολές». Η εταιρεία διευκρίνισε ωστόσο ότι τα άλλα μοντέλα ΤΝ της Google ενδέχεται να εξακολουθούν να χρησιμοποιούνται για απλούστερες εργασίες.
Η Alphabet και οι ανταγωνιστές της δαπανούν υπέρογκα ποσά για την ανάπτυξη υποδομών ΤΝ και την ταχεία δημιουργία περισσότερων υπηρεσιών για καταναλωτές και επιχειρήσεις. Στα οικονομικά τους αποτελέσματα τον περασμένο μήνα, οι Alphabet, Meta, Microsoft και Amazon αύξησαν τις προβλέψεις τους για τις κεφαλαιουχικές δαπάνες και αναμένουν συλλογικά ότι ο αριθμός αυτός θα ξεπεράσει τα 380 δισεκατομμύρια δολάρια φέτος. Η Google δήλωσε ότι οι απαντήσεις ΤΝ που υποστηρίζονται από το Gemini 3 θα «ανταλλάσσουν τα κλισέ και την κολακεία με αυθεντική διορατικότητα, λέγοντάς σας αυτό που πρέπει να ακούσετε, όχι αυτό που θέλετε να ακούσετε», σύμφωνα με δήλωση του Demis Hassabis, CEO της μονάδας DeepMind της Google.
Η Google ανακοίνωσε επίσης μια νέα πλατφόρμα πρακτόρων με την ονομασία «Google Antigravity», η οποία επιτρέπει στους προγραμματιστές να γράφουν κώδικα «σε ένα υψηλότερο επίπεδο προσανατολισμένο στις εργασίες». Το Gemini 3 είναι το «καλύτερο μοντέλο vibe coding που είχε ποτέ» η εταιρεία, δήλωσε ο Josh Woodward, αντιπρόεδρος των Google Labs και του Gemini. Ο όρος vibe coding αναφέρεται σε μια ταχέως αναδυόμενη αγορά εργαλείων που επιτρέπουν στους προγραμματιστές λογισμικού να παράγουν κώδικα μέσω εντολών.
Η Google ανέφερε ότι το νέο μοντέλο θα καταστήσει δυνατές τις «παραγωγικές διεπαφές», παρέχοντας ορισμένες απαντήσεις με τρόπο που μοιάζει με ψηφιακό περιοδικό. Ως παράδειγμα, η εταιρεία ζήτησε από το Gemini να «εξηγήσει την Πινακοθήκη Βαν Γκογκ με βιογραφικό πλαίσιο για κάθε έργο». Το αποτέλεσμα ήταν μια πολύχρωμη επεξήγηση με βάση την εικόνα για κάθε πίνακα. Εντός του AI Mode, το Gemini 3 θα είναι αρχικά διαθέσιμο σε συνδρομητές επί πληρωμή. Θα έχει τη δυνατότητα να αναλύει μια ερώτηση και να δημιουργεί μια διάταξη με οπτικά στοιχεία όπως εικόνες, πίνακες και πλέγματα. Η Google δήλωσε ότι μπορεί να κατασκευάσει έναν προσαρμοσμένο διαδραστικό υπολογιστή δανείων ή μια διαδραστική προσομοίωση για ένα περίπλοκο πρόβλημα φυσικής.
Οι προγραμματιστές θα έχουν τη δυνατότητα πρόσβασης στο API του Gemini και οι επιχειρήσεις θα μπορούν να το ενσωματώσουν μέσω του Vertex AI, της υπηρεσίας cloud της Google που έχει σχεδιαστεί για τη δημιουργία, την ανάπτυξη και τη διαχείριση μοντέλων ΤΝ. Για τους εταιρικούς πελάτες, το Gemini 3 μπορεί να εκτελέσει εργασίες όπως η δημιουργία διαδικασιών ένταξης και εκπαίδευσης εργαζομένων, η ακριβέστερη ανάλυση βίντεο και εικόνων από χώρους εργοστασίων, καθώς και η διεκπεραίωση προμηθειών, όπως ανέφερε η εταιρεία.
Την περασμένη εβδομάδα, η OpenAI κυκλοφόρησε δύο ενημερώσεις για το GPT-5. Η μία είναι «πιο θερμή, πιο ευφυής και καλύτερη στην τήρηση των οδηγιών σας», ανέφερε η εταιρεία, ενώ η άλλη είναι «ταχύτερη σε απλές εργασίες και πιο επίμονη στις σύνθετες».
