Πριν ένα χρόνο στη σκηνή του I/O για πρώτη φορά μοιραστήκαμε τα σχέδιά μας για το Gemini, μια οικογένεια μοντέλων AI πολυτροπικής απεικόνισης, τα οποία είναι ικανά να συλλογίζονται χρησιμοποιώντας κείμενο, εικόνες, βίντεο, κώδικα και άλλα. Το λανσάρισμα της Gemini εποχής τον Δεκέμβριο του 2023 σηματοδότησε ένα μεγάλο βήμα στο να μπορούμε να μετατρέπουμε οποιαδήποτε “Είσοδο” σε οποιαδήποτε “Έξοδο” – ένα “I/O” για μια νέα γενιά.
Στο φετινό Google I/O δείξαμε πώς η Google λειτουργεί πλήρως στην εποχή του Gemini, παρουσιάζοντας καινοτόμες λύσεις AI σε προϊόντα, έρευνα και υποδομή, καθώς και πώς αυτό μας φέρνει πιο κοντά στον τελικό μας στόχο, που είναι να κάνουμε την Τεχνητή Νοημοσύνη χρήσιμη για όλους. [Sundar Blog Post].
Όλα τα προϊόντα της Google με περισσότερους από δύο δισεκατομμύρια χρήστες είναι φτιαγμένα με την τεχνολογία Gemini. Στην εκδήλωση μοιραστήκαμε πώς αυτό μας βοηθά να δημιουργήσουμε νέες εμπειρίες και να κάνουμε τα προϊόντα μας ακόμα πιο χρήσιμα:
- Επέκταση των AI Overviews στην Αναζήτηση. Με ένα νέο προσαρμοσμένο μοντέλο Gemini — ικανό για συλλογισμό πολλαπλών βημάτων, σχεδιασμό και πολυτροπικότητα — σε συνδυασμό με την καλύτερη Αναζήτηση στην κατηγορία, θα μπορείτε σύντομα να κάνετε σύνθετες ερωτήσεις πολλαπλών βημάτων, να προσαρμόζετε τα αποτελέσματα αναζήτησης και ακόμη και να κάνετε ερωτήσεις με βίντεο [Blog Post]
- Παρουσιάζοντας το Ask Photos. Πάνω από έξι δισεκατομμύρια φωτογραφίες ανεβαίνουν κάθε μέρα στο Google Photos. Με τις πολυτροπικές δυνατότητες του Gemini, επαναπροσδιορίζουμε τον τρόπο με τον οποίο μπορείτε να αναζητήσετε τις φωτογραφίες και τα βίντεο σας. Θέλετε να βρείτε μια συγκεκριμένη ανάμνηση ή να ανακαλέσετε πληροφορίες που είναι κρυμμένες στη συλλογή σας; Απλά ρωτήστε το Ask Photos. [Blog Post]
- Νέοι τρόποι αλληλεπίδρασης με το Gemini στο Workspace. Οι δυνατότητες του Gemini θα επεκταθούν σε περισσότερους χρήστες και θα ενσωματωθούν στο πλαϊνό πλαίσιο του Gmail, των Docs, του Drive, των Slides και των Sheets. Επιπλέον, λειτουργίες του Gemini θα προστεθούν και στην εφαρμογή Gmail για κινητά. [Blog Post]
- Gemini για Android. Δημιουργούμε τεχνολογία AI απευθείας στο λειτουργικό σύστημα Android. Οι μαθητές μπορούν τώρα να λάβουν βοήθεια στις ασκήσεις τους κυκλώνοντας προβλήματα με το Circle to Search. Η επικάλυψη του Gemini θα παρέχει δυναμικές προτάσεις σχετικά με το τι υπάρχει στην οθόνη σας. Για παράδειγμα, μπορείτε να ζητήσετε να σας συνοψίσει ένα PDF ή να χρησιμοποίησετε την επιλογή «Ρωτήστε Αυτό το Βίντεο». Επιπλέον, το TalkBack με την υποστήριξη του Gemini θα μπορεί να παρέχει ακόμα πιο λεπτομερείς περιγραφές εικόνων. [Blog Post]
Επίσης, λανσάρουμε το Gemini 1.5 Pro στους συνδρομητές του Gemini Advanced σε περισσότερες από 35 γλώσσες, μαζί με μία σειρά ενός εκατομμυρίου ακολουθιών κειμενικών χαρακτήρων που τα LLM μετατρέπουν σε αριθμητικές αναπαραστάσεις. Το Gemini 1.5 Pro αποτελεί το μεγαλύτερο από οποιοδήποτε ευρέως διαθέσιμο chatbot για καταναλωτές σε ολόκληρο τον κόσμο. Αυτό σημαίνει ότι μπορεί να κατανοήσει περισσότερες πληροφορίες από ποτέ, όπως ένα αρχείο PDF 1.500 σελίδων, ενώ σύντομα θα μπορεί να κατανοήσει 30.000 γραμμές κώδικα καθώς και βίντεο διάρκειας μιας ώρας.
- Οι συνδρομητές του Gemini Advanced θα αποκτήσουν σύντομα πρόσβαση στο Live, μια νέα εμπειρία συνομιλίας μέσω κινητού. Με το Live, θα έχετε τη δυνατότητα να μιλήσετε στο Gemini και να επιλέξετε από μία ευρεία γκάμα διαφορετικών φωνών με φυσικό ήχο. Επίσης, θα μπορείτε να μιλήσετε με τον δικό σας ρυθμό, έχοντας τη δυνατότητα να διακόψετε με ερωτήσεις, κάνοντας τις συνομιλίες πιο εύληπτες. [Blog Post]
Ταυτόχρονα, κοιτάζουμε προς το μέλλον, προς τα επόμενα μοντέλα: Μοιραστήκαμε περισσότερες λεπτομέρειες για το Gemini 1.5 Flash, ένα μοντέλο με καλή σχέση κόστους-απόδοσης, το οποίο βασίζεται κυρίως στα σχόλια των χρηστών, με μικρότερες καθυστερήσεις. Επίσης, το Project Astra, το όραμά μας για την επόμενη γενιά βοηθών Τεχνητής Νοημοσύνης, αποτελεί έναν εκπρόσωπο που μπορεί να κατανοεί και να ανταποκρίνεται γρήγορα στις συνομιλίες. [Blog Post]
Ακόμη, συνεργαζόμαστε στενά με τη δημιουργική κοινότητα για να διερευνήσουμε πώς η παραγωγική τεχνητή νοημοσύνη μπορεί να υποστηρίξει καλύτερα τη δημιουργική διαδικασία καθώς και για να διασφαλίσουμε ότι τα εργαλεία μας για την Tεχνητή Nοημοσύνη είναι όσο το δυνατόν πιο χρήσιμα σε κάθε στάδιο:
- Παρουσιάζουμε το Veo, το πιο ικανό μας μοντέλο για τη δημιουργία βίντεο υψηλής ευκρίνειας, και το Imagen 3, ένα μοντέλο, το οποίο έχει την υψηλότερη ποιότητα στη μετατροπή κειμένου σε εικόνα. Επίσης, μοιραζόμαστε κάποιες νέες ηχογραφήσεις— με συμμετέχοντες καλλιτέχνες από όλο τον κόσμο — που έχουν δημιουργηθεί με το Music AI Sandbox. [Blog Post]
Φυσικά, αυτές οι εξελίξεις στην Τεχνητή Νοημοσύνη μπορούν να υλοποιηθούν μόνο μέσω μιας πραγματικά πρωτοποριακής υποδομής τεχνολογίας. Η εκπαίδευση υπερσύγχρονων μοντέλων απαιτεί μεγάλη υπολογιστική ισχύ.
- Παρουσιάσαμε το Trillium, το TPU μας 6ης γενιάς, το οποία προσφέρει βελτίωση 4,7 φορές στην υπολογιστική απόδοση ανά τσιπ σε σύγκριση με την προηγούμενη γενιά, το TPU v5e. Θα είναι διαθέσιμο στους πελάτες Cloud αργότερα μέσα στη χρονιά. [Blog Post]
Βασικό συστατικό της τολμηρής καινοτομίας είναι η υπεύθυνη καινοτομία. Έτσι, αναπτύσσουμε μια τεχνολογία αιχμής που ονομάζεται “AI–assisted red teaming“ και βασίζεται σε καινοτόμα χαρακτηριστικά παιχνιδιών που έχει αναπτύξει η Google DeepMind, όπως το AlphaGo, επεκτείνοντας τις τεχνικές μας καινοτομίες υδατογράφησης, όπως το SynthID, σε δύο νέες μορφές – κείμενο και βίντεο- έτσι ώστε το περιεχόμενο που δημιουργείται από το AI να είναι πιο εύκολο να εντοπιστεί. [Blog Post]
Χρησιμοποιώντας τη δύναμη του Gemini, στοχεύουμε να κάνουμε την Τεχνητή Νοημοσύνη χρήσιμη για όλους. Αποστολή της Google είναι να οργανώσει τις πληροφορίες του κόσμου από κάθε πηγή, να τις κάνει προσβάσιμες μέσω οποιουδήποτε τρόπου και να συνδυάσει τις παγκόσμιες πληροφορίες με τις δικές σας, με τρόπο που να είναι πραγματικά χρήσιμο για εσάς. Το Gemini θα μας βοηθήσει να φτάσουμε σε αυτόν τον στόχο.