Η Google έφτιαξε ένα AI μοντέλο καλύτερο από τον άνθρωπο
Το νέας γενιάς εργαλείο Τεχνητής Νοημοσύνης λέγεται Gemini και μόλις κυκλοφόρησε, μιμούμενο σε πολυπλοκότητα τον ανθρώπινο εγκέφαλο.
- 7 ΔΕΚ 2023
Εκτιμάται ότι ο ανθρώπινος εγκέφαλος διαθέτει 86 δισεκατομμύρια νευρώνες, που συνδέονται με πολλαπλούς και διαπλεκόμενους τρόπους, σχηματίζοντας ένα εκπληκτικά περίπλοκο (και σε μεγάλο βαθμό αχαρτογράφητο ακόμη) δίκτυο που μας εξασφαλίζει τη δυνατότητα να αντιλαμβανόμαστε τον κόσμο γύρω μας και να αντιδρούμε πηγαία στα ερεθίσματα που λαμβάνουμε ανά πάσα στιγμή, όπως τα γράμματα που διαβάζεις αυτή τη στιγμή, ενώ ενδεχομένως ακούς μουσική και σκέφτεσαι φευγαλέα πως έπρεπε να είχες πάρει ομπρέλα βλέποντας τα σύννεφα.
Μήπως ξέχασες τον θερμοσίφωνα ανοιχτό;
Μέσα σε κλάσματα του δευτερολέπτου, το μυαλό μεταφράζει τα εξωτερικά δεδομένα και αντιδρά, δίνει εξηγήσεις, κάνει συνειρμούς, λύνει μικρά ή μεγάλα προβλήματα με τρόπους που δεν βασίζονται απαραίτητα σε μοτίβα, αλλά στην ευρηματικότητα, τον συνδυασμό γνώσεων και την πρωτοτυπία. Πράγματα τα οποία πιστεύαμε –είτε θέλαμε να πιστεύουμε– ότι θα μείνουν προνόμιου του ανθρώπινου είδους, αλλά το νέας γενιάς AI μοντέλο της Google ισχυρίζεται ότι τα κατέχει και μάλιστα σε καλύτερο και πιο αποτελεσματικό βαθμό από τον ίδιο τον άνθρωπο.
Όπως δήλωσε ο Demis Hassabis, CEO και συνιδρυτής της Google DeepMind, «πλέον, βρισκόμαστε ένα βήμα πιο κοντά στο όραμα να κάνουμε την Τεχνητή Νοημοσύνη να μη μοιάζει με ένα έξυπνο κομμάτι λογισμικού, αλλά με κάτι πραγματικά χρήσιμο κι επαναστατικό – να είναι ένας εξειδικευμένο βοηθός».
Το όνομα αυτού του βοηθού είναι Gemini και μπορεί να εμπίπτει στην ίδια οικογένεια με τις εκδόσεις του αντίπαλου ChatGPT, αλλά κατασκευαστικά απέχει χιλιόμετρα από αυτές, άρα και από όσα γνωρίζαμε μέχρι στιγμής για τις δυνατότητες και τα όρια της τεχνητής νοημοσύνης.
Gemini, το πιο ικανό πολυπαραμετρικό μοντέλο AI σήμερα
Ουσιαστικά δεν πρόκειται για ένα μεμονωμένο AI μοντέλο, αλλά για πολλά μοντέλα ενωμένα απ’ την αρχή του σχεδιασμού: όσα εργαλεία γνωρίζαμε μέχρι σήμερα (ChatGPT, DALL-E, Claude κ.ο.κ.) είχαν αντικειμενικούς περιορισμούς στα είδη των δεδομένων τα οποία είναι σε θέση να επεξεργαστούν, μάλιστα αυτό φαινόταν και στο αποτέλεσμα που συχνά αποδεικνυόταν προβληματικό ή απλά αστείο.
Αντίθετα, το Gemini «είναι από τη βάση του πολυπαραμετρικό (multimodal), ώστε να μπορεί να συνομιλεί απρόσκοπτα μεταξύ διαφορετικών παραμέτρων για να προσφέρει την καλύτερη δυνατή απόκριση», όπως εξήγησε σε βίντεο ο Oriol Vinyals της Google DeepMind. Η πολυπλοκότητά του μιμείται δηλαδή τον ανθρώπινο εγκέφαλο, δίνοντάς τη δυνατότητα στο καινοτόμο εργαλείο να μην έχει όριο στον τύπο της πληροφορίας που μπορεί να επεξεργαστεί.
Προς το παρόν, δύναται να κινηθεί με άνεση σε κειμενικό περιεχόμενο, κώδικα, ήχο και βίντεο (π.χ. αποφασίζοντας πότε είναι έτοιμη η ομελέτα, όπως έδειχνε το βίντεο που δημοσιεύτηκε με το λανσάρισμα του εργαλείου), αλλά στο άμεσο μέλλον «πρόκειται να είναι ακόμη πιο γενικές οι δεξιότητές του».
Όπως επεσήμανε ο Demis Hassabis, «υπάρχουν ακόμη πράγματα όπως η κίνηση και η επαφή – πράγματα τα οποία παραπέμπουν σε ρομπότ». Προοδευτικά, το Gemini θα αποκτήσει περισσότερες αισθήσεις, θα γίνει πιο συνειδητοποιημένο και ακριβές στη διαδικασία. «Αυτά τα μοντέλα είναι φτιαγμένα ώστε να μπορούν να καταλάβουν καλύτερα τον κόσμο γύρω τους».
Το πρώτο τεστ έφερε αποτελέσματα πέρα από κάθε προσδοκία: το νέο ΑΙ υπερ-μοντέλο αποδεικνύεται το πρώτο που ξεπέρασε τους ειδικούς στη μαζική κατανόηση και επίλυση προβλημάτων σε περιεχόμενο το οποίο συνδύαζε ταυτόχρονα 57 διαφορετικούς τομείς, όπως μαθηματικά, φυσική, ιστορία, νόμος, ιατρική αλλά και ζητήματα ηθικής.
Πρόκειται συγκεκριμένα για το πιο εξελιγμένο από τα τρία προϊόντα της οικογένειας που λανσάρονται στην αγορά: είναι το Gemini Ultra («το πιο ικανό και μεγάλο μοντέλο για υψηλών απαιτήσεων εργασίες»), το Gemini Pro («το καλύτερο μοντέλο για την ευρύτερη ποικιλία των εργασιών») και το Gemini Nano, το οποίο έρχεται στις συσκευές μας.
Μπορώ να έχω το Gemini στο κινητό μου;
Το Gemini είναι αποτέλεσμα πολύμηνης έρευνας και συνεργασίας των επιμέρους ομάδων της Google, ένα επίτευγμα το οποίο μέλλει να επεκταθεί σε όλες τις πτυχές και λειτουργίες της εταιρίας, όπως το Google Search, τις διαφημίσεις και το Chrome. Μια πρώτη γεύση μπορούμε να πάρουμε από τον νέο Bard: ο άυλος βοηθός της Google εξοπλίστηκε με το Gemini Pro (μόνο για χρήση σε αγγλική γλώσσα προς το παρόν), δίνοντας την υπόσχεση ότι διαθέτει πλέον εκπληκτικά πιο γρήγορη ταχύτητα επεξεργασίας δεδομένων και συνδυαστική σκέψη, πράγμα που θα φαίνεται στην εγκυρότητα των αποτελεσμάτων.
Εκείνο που κατασκευάστηκε για on-device χρήση είναι το Gemini Nano, το οποίο μάλιστα έχει δυνατότητα off line επεξεργασίας και λειτουργίας. Αλλά για τώρα, οι μόνες συμβατές συσκευές είναι τα Pixel 8 Pro – σε αυτά, εμφανίζεται πλέον δυνατότητα αυτόματης σύνοψης και το τμήμα Έξυπνης απάντησης του πληκτρολογίου Gboard.
Φαίνεται ότι πολύ σύντομα, αντίστοιχα εργαλεία θα εμφανιστούν και στις νέες Android συσκευές που θα βγαίνουν σε κυκλοφορία.