Google lancia Gemini 3: il modello AI più avanzato tra ragionamento, multimodalità e autonomia
News inserita da: Simone Rossi (Satred)
Fonte: Digital-News (original)
Gemini 3 rivoluziona l’Intelligenza Artificiale
con capacità di pensiero da dottorato, analisi multimodale
e azione autonoma per utenti, sviluppatori e aziende.
A quasi due anni dall'inaugurazione di quella che è stata definita l'era Gemini, Google ha compiuto un balzo evolutivo significativo nel campo dell'Intelligenza Artificiale, presentando ufficialmente il suo modello di punta: Gemini 3. Questo lancio non è solo l'introduzione di un nuovo prodotto, ma segna una tappa fondamentale in uno dei più ambiziosi sforzi scientifici e di prodotto mai intrapresi dall'azienda. La portata globale dei modelli precedenti è già impressionante: AI Overview raggiunge oggi due miliardi di utenti mensili, l'app Gemini supera i 650 milioni di utenti al mese e oltre il 70% dei clienti Cloud di Google sfrutta l'AI. È in questo contesto di adozione massiva che si inserisce la terza generazione, nata per spingere i limiti non solo della cognizione, ma anche dell'azione autonoma.
"Gemini 3 è il nostro modello più intelligente che vi aiuta a dare vita a qualsiasi idea," hanno dichiarato Demis Hassabis, CEO di Google DeepMind, Koray Kavukcuoglu, CTO di Google DeepMind, e Sundar Pichai, CEO di Google e Alphabet, nella loro nota congiunta.
Ogni iterazione della piattaforma Gemini ha consolidato le basi per l'innovazione successiva. Se Gemini 1 ha introdotto la multimodalità nativa e una finestra contestuale estesa, e Gemini 2 ha posto le fondamenta per le funzionalità agentiche e l'ampliamento del pensiero e del ragionamento, Gemini 3 eleva drasticamente la capacità di comprendere il mondo circostante. Il nuovo modello è progettato per cogliere la profondità e le sfumature, che si manifestano nell'abilità di percepire indizi sottili in un concetto creativo o di analizzare strati complessi di un problema difficile.
A riprova della sua intelligenza superiore, Gemini 3 Pro, rilasciato inizialmente in anteprima, supera in modo significativo Gemini 2.5 Pro in ogni principale benchmark di settore. Il modello ha stabilito un punteggio rivoluzionario di 1501 Elo nella classifica LMArena. Le sue capacità di ragionamento raggiungono il livello di un dottorato di ricerca, come dimostrato dai punteggi massimi ottenuti in esami d'elite come l'Humanity's Last Exam (37,5% senza strumenti) e il GPQA Diamond (91,9%). Inoltre, ridefinisce lo standard della matematica di frontiera, toccando il 23,4% su MathArena Apex. Non solo testo: Gemini 3 Pro eccelle anche nel ragionamento multimodale, conseguendo punteggi rivoluzionari dell'81% su MMMU-Pro e dell'87,6% su Video-MMMU. Questa sofisticata comprensione multimodale, unita a un'accuratezza fattuale potenziata (72,1% su SimpleQA Verified), lo rende uno strumento altamente affidabile per la risoluzione di problemi complessi in discipline scientifiche e matematiche. Il modello, inoltre, offre un livello di approfondimento e sfumatura tale da preferire un'analisi autentica e concisa, agendo come un vero e proprio "partner di pensiero".
Per le sfide più ardue, Google ha introdotto la modalità Gemini 3 Deep Think, una configurazione che spinge ulteriormente i confini dell'intelligenza, offrendo un cambiamento radicale nelle capacità di ragionamento e comprensione. Sebbene sia ancora in fase di valutazione da parte dei tester di sicurezza prima di essere reso disponibile agli abbonati Google AI Ultra, i test hanno mostrato performance impressionanti, superando le già eccellenti prestazioni di Gemini 3 Pro (41,0% in Humanity's Last Exam e 93,8% in GPQA Diamond). In particolare, Deep Think ha raggiunto un valore senza precedenti del 45,1% su ARC-AGI con esecuzione del codice, evidenziando la sua capacità di affrontare sfide inedite.
Grazie al suo ragionamento all'avanguardia, alla comprensione spaziale e alla finestra contestuale da un milione di token, Gemini 3 si propone come un partner ideale per l'apprendimento in ogni modalità: testo, immagini, video, audio e codice. La sua utilità si estende dalla decifrazione e traduzione di ricette di famiglia scritte a mano, con la creazione di ricettari digitali condivisibili, fino all'analisi di lunghi video tutorial o articoli accademici, trasformandoli in flashcard interattive o piani di allenamento personalizzati. Nella Ricerca, la modalità AI ora utilizza Gemini 3 per abilitare nuove esperienze di interfaccia utente generativa, come layout visivi immersivi e simulazioni interattive, create in tempo reale. L'accelerazione dell'intelligenza del modello con Gemini 3 ha permesso a Google di ridefinire l'intera esperienza degli sviluppatori. Gemini 3 è, infatti, il miglior modello mai creato per la programmazione basata su agenti e vibe coding. È in grado di gestire prompt complessi per il rendering di interfacce utente web interattive, aumentando l'autonomia dei prodotti e la produttività degli sviluppatori. Il modello svetta nella classifica WebDev Arena con un punteggio ELO di 1487 e supera nettamente il suo predecessore 2.5 Pro in benchmark cruciali per gli agenti di programmazione, come SWE-bench Verified (76,2%).
Per incanalare questa nuova potenza, Google ha lanciato Google Antigravity, una nuova piattaforma di sviluppo agentica. Questa piattaforma trasforma l'assistenza AI da un semplice strumento a un "partner attivo". Sfruttando le capacità avanzate di ragionamento e l'uso di strumenti di Gemini 3, gli agenti all'interno di Antigravity ottengono accesso diretto all'editor, al terminale e al browser, permettendo loro di pianificare ed eseguire autonomamente attività software complesse, end-to-end, e di convalidare il proprio codice. La piattaforma integra, oltre a Gemini 3 Pro, anche modelli specifici come Gemini 2.5 Computer Use per il controllo del browser e Nano Banana (Gemini 2.5 Image) per l'editing di immagini.
Il progresso agentico di Gemini 3 si estende anche alla pianificazione a lungo termine. Il modello eccelle nella classifica Vending-Bench 2, un test che simula la gestione di un'attività di distributori automatici per un intero anno virtuale, dimostrando un utilizzo coerente degli strumenti e un processo decisionale affidabile. Ciò si traduce in funzionalità pratiche per la vita quotidiana, permettendo a Gemini di agire per conto dell'utente nella gestione di flussi di lavoro complessi e multifase, come l'organizzazione della posta in arrivo di Gmail o la pianificazione di itinerari di viaggio, sempre sotto la guida e il controllo dell'utente. Gli abbonati a Google AI Ultra possono già testare queste funzionalità tramite Gemini Agent nell'app dedicata. Nonostante il vertiginoso aumento di potenza, la sicurezza è rimasta una priorità assoluta. Gemini 3 è definito come il modello più sicuro mai rilasciato da Google. Ha superato la serie più completa di valutazioni di sicurezza fino ad oggi e presenta miglioramenti significativi, tra cui una ridotta tendenza ad assecondare l'utente, una maggiore resistenza agli attacchi di prompt injection e una migliore protezione contro gli abusi tramite attacchi informatici.
Per garantire l'affidabilità, Google ha collaborato con enti di fama mondiale e ha fornito accesso anticipato a organismi come l'UK AISI, oltre a ottenere valutazioni indipendenti da esperti del settore come Apollo, Vaultis e Dreadnode.
"Oggi compiamo un altro grande passo verso l'AGI e rilasciamo Gemini 3," hanno ribadito i vertici di Google DeepMind.
Questo lancio è, a tutti gli effetti, solo l'inizio dell'era Gemini 3. Il modello è già disponibile per tutti nell'app Gemini e in modalità AI nella Ricerca, per gli sviluppatori nell'API Gemini in AI Studio e nella nuova piattaforma Google Antigravity, e per le aziende in Vertex AI. Con l'impegno a continuare a spingere i confini dell'intelligenza, degli agenti e della personalizzazione, Google sta ponendo le basi per un futuro in cui l'AI non si limiterà a rispondere alle domande, ma diventerà un partner proattivo, capace di eseguire autonomamente intere catene di compiti complessi. L'azienda promette il rilascio di ulteriori modelli della serie Gemini 3 a breve, anticipando un futuro di possibilità creative e operative in continua espansione.