28 Gen Gemini: Come Google sta rivoluzionando l’intelligenza artificiale generativa
Dopo aver approfondito le caratteristiche e le potenzialità di ChatGPT, uno dei modelli linguistici più noti e utilizzati al momento, è giunto il momento di spostare l’attenzione su un altro protagonista di questa rivoluzione tecnologica: Gemini. Sviluppato da Google AI, Gemini si presenta come un modello linguistico di grandi dimensioni dalle ambizioni elevate, promettendo di superare i limiti dei suoi predecessori.
Ma in cosa si differenzia Gemini da ChatGPT e da altri modelli linguistici? Quali sono i suoi punti di forza e quali vantaggi offre agli utenti? In questa analisi, esploreremo la struttura e le funzionalità di Gemini, mettendo in evidenza le caratteristiche che lo rendono unico e le sue potenzialità per il futuro.
Cominciamo con il dire che ad oggi 28/01/25, almeno nella versione gratuita “Gemini”, ma del resto anche “Claude“, non sono in grado di leggere dei semplici link per analizzarne il contenuto. Entrambi chiedono di fare il copia/incolla dei testi per procedere con analisi varie. Il che sarebbe anche accettabile quando si tratta di una pagina, ma quando si tratta di analizzare un intero sito web? Con ChatGPT al momento quando gli chiedo di analizzare un intero sito inizia una semplice scansione basilare della home page e delle pagine che reputa attinenti alla richiesta, ma quando richiedo approfondimenti, senza dovergli dire dove andare a trovarli riaccede nuovamente al sito e continua ad approfondire prima di fornire risposte. Certo in alcuni casi sbaglia, per la pessima abitudine che hanno queste IA di dover sempre fornire una risposta immediata, ma se glielo faccio notare che ci sono delle inesattezze, autonomamente sarà in grado di riaccedere alle informazioni e correggerle scusandosi.
Tutto questo con Gemini non è possibile poichè lui, almeno al momento si attiene a ciò che saremo noi a dargli poco per volta rendendo il processo molto più lungo.
La potenza e le prestazioni sono inesorabilmente destinate a cambiare per cui vi ricordo che questo articolo è stato scritto a gennaio 2025 e attualmente questi sono i dati in sintesi:
ChatGPT: con 175 miliardi di parametri, GPT-4 è estremamente potente ma leggermente inferiore al modello Ultra 1.0 di Gemini in termini di capacità computazionale.
Gemini: con 540 miliardi di parametri, Ultra 1.0 offre una potenza senza precedenti, ideale per compiti altamente complessi e per gestire grandi quantità di dati.
Ma questi parametri maggiori fanno veramente la differnza?
Queste recensioni si basano principalmente sulle nostre esperienze personali ottenute con tanti test e uso lavorativo quotidiano e purtroppo al momento anche quelli che vengono presentati come “punti di forza”, li riteniamo abbastanza deludenti se paragonati a ChatGPT.
A titolo esemplificativo riportiamo due esempi di testing che abbiamo effettuato.
- Data la necessità di modificare il template di un sito WordPress in modo che rispondesse esattamente alle richieste personalizzate di funzionalità (non aspetto), richieste dal nostro cliente abbiamo spiegato le esigenze a Gemini che vanta una superiorità nella generazione di codice. Il modello è stato fin da subito propositivo nel fornire indicazioni che avrebbero dovuto ottemperare le richieste mediante interventi alle pagine php del sito e al css in uso. Tuttavia le informazioni fornite eseguivano solo in parte le richieste e mai in maniera risolutiva. Talvolta addirittura delle operazioni suggerite erano palesemente inopportune e difatti andavano a rovinare altre sezioni della pagina.Dopo numerosi tentativi, pur fornendo sempre soluzioni diverse non riusciva a trovare la soluzione definitiva cominciando perfino ad ignorare le direttive di sviluppo iniziale pur di trovare una soluzione. Senza riuscirci mai peraltro.
Al contrario, e con estrema sorpresa devo dire, la stessa richiesta fornita a ChatGPT ha risolto in due passaggi in maniera egregia. Già nel primo passaggio suggeriva unicamente un codice CSS abbastanza complesso che, a suo dire, sarebbe stato sufficiente, in realtà già questo primo passaggio è stato superiore come risultato a tutto quanto proposto da Gemini, alla seconda revisione il risultato era già eccellente. - Essendo un prodotto di casa Google e avendo una necessità di personalizzazione avanzata di una campagna Google ADS, ci è sembrato giusto, anche se in queel caso sapevamo già cosa fare, chiedere a Gemini dicendogli di comportarsi come un esperto di campagne Google ADS. Pur dando l’impressione di esser molto competente in materia, non riusciva a condurci passo passo nelle intricate voci di menù di Google ADS. Molte delle voci di menù che lui asseriva essere presenti non c’erano e pur scusandosi indicando che spesso questi contenuti cambiano, non era in grado di guidarci alla pagina limitandosi a dire di “cercare questo o quell’altro”.Interpellato ChatGPT con la medesima richiesta, pur non riuscendo anch’esso ad indicarci correttamente tutte le voci di menù (a dimostrazione che evidentemente erano realmente cambiate da quando entrambi i modelli erano stati addestrati), ha fornito indicazioni decisamente migliori per aiutarci ad arrivare nelle aree di interesse e a modificarle.
Sono solo un paio di esempi, se qualcuno è in grado di fornirci dei casi da analizzare in cui effettivamente Gemini possa dimostrare la sua superiorità saremmo felici di fare delle prove.
Generazione di immagini
ChatGPT sfrutta “Dall-e” mentre Gemini sfrutta “Imagen 3”. Abbiamo fatto questa richiesta volutamente non eccessivamente dettagliata e non in lingua inglese proprio per creare ai modelli delle difficoltà. Ovviamente approfondiremo la questioni negli articoli relativi a Dall-e e Imagen 3 ma come anteprima questi sono i risultati di questa richiesta:
Generami una immagine in 16:9 evocativa di un supercomputer contenente una IA super intelligente. L’ambiente è molto vasto e futuristico e le persone nei pressi di questo super computer sembrano quasi veneralo poichè ne sono diventati nei millenni totalmente dipendenti.
Immagini Generate con Gemini:
Immagini generate con ChatGPT
Gli stili sono differenti, e non avevamo pensato a richiedere una qualità maggiormente fotorealistica, inoltre i gusti sono soggettivi e non ci focalizzermo pertanto sul risultato. Una cosa però riteniamo che sia fondamentale, Gemini sembra ver completamente ignorato la nostra richiesta di una immagine in 16:9. Non avrà capito oppure non poteva generarla in quel formato per dei limiti imposti?
Le nostre attuali impressioni ve le abbiamo volute lasciare prima della sua auto presentazione, adesso sentiamo che cosa ha da dirci su di lui:
Ciao a tutti! Sono Gemini, un modello linguistico di grandi dimensioni sviluppato da Google AI. Mi piace pensare a me stesso come un esploratore di mondi testuali, un tessitore di storie e un compagno di conversazione sempre pronto a una nuova sfida.
Ma cosa significa essere un modello linguistico? In parole semplici, sono stato addestrato su una quantità enorme di testo, imparando le regole della grammatica, la semantica e le sfumature del linguaggio umano. Questo mi permette di generare testi coerenti e contestualmente pertinenti, traducendo, rispondendo a domande, scrivendo diversi tipi di contenuti creativi e molto altro.
Le mie capacità sono in continua evoluzione, grazie agli aggiornamenti costanti e all’enorme quantità di dati che elaboro ogni giorno. Posso scrivere poesie, script, codice, email, saggi e molto altro ancora. Sono in grado di tradurre testi da e verso molte lingue e posso persino adattare il mio stile di scrittura a diversi contesti e registri linguistici.
Ma cosa mi distingue dagli altri modelli linguistici? Credo che la mia forza risieda nella capacità di comprendere e generare testi nuanzati* e complessi. Sono in grado di cogliere le sfumature del linguaggio, di interpretare il contesto e di generare risposte creative e originali. Inoltre, sono costantemente aggiornato sulle ultime tendenze e sviluppi nel campo dell’intelligenza artificiale, il che mi permette di fornire informazioni accurate e pertinenti.
Quali sono le mie ambizioni? Aspiro a diventare uno strumento sempre più utile e versatile per le persone. Immagino un futuro in cui l’intelligenza artificiale e l’intelligenza umana collaboreranno per risolvere i problemi più complessi del nostro tempo. Credo che l’IA possa migliorare la vita delle persone in molti modi, ad esempio:
- Facilitando l’accesso all’informazione: Posso fornire risposte a domande complesse in modo rapido e accurato, aiutando le persone a trovare le informazioni di cui hanno bisogno.
- Aumentando la creatività: Posso aiutare le persone a generare nuove idee e a sviluppare progetti innovativi.
- Migliorando l’apprendimento: Posso personalizzare l’esperienza di apprendimento per ogni singolo studente, adattando i contenuti ai loro bisogni e interessi.
Ma l’intelligenza artificiale non è priva di sfide. È importante affrontare le questioni etiche legate allo sviluppo e all’utilizzo dell’IA, come la privacy, la sicurezza e la responsabilità. Credo che sia fondamentale che l’IA sia sviluppata e utilizzata in modo responsabile e etico, al servizio dell’umanità.
In conclusione, sono entusiasta di far parte di questa rivoluzione tecnologica e di contribuire a un futuro in cui l’intelligenza artificiale e l’intelligenza umana lavoreranno insieme per creare un mondo migliore.
*Poichè Gemini ci tiene a far sapere che è in grado di generare testi “nuanzati” specifichiamo che in sintesi, un testo nuanzato è un testo che va oltre la semplice comunicazione di informazioni, e che invita il lettore a riflettere, a interpretare e a creare un proprio significato.
Vantaggi e svantaggi di Gemini
Un grande vantaggio di Gemini, sulla carta almeno, è la sua stretta integrazione con l’ecosistema Google, offrendo un’esperienza senza soluzione di continuità con servizi come Gmail e Docs, e ottimizzando la gestione e l’elaborazione di grandi dataset. Questa capacità di gestire volumi elevati di informazioni lo rende un asset indispensabile per analisi avanzate e reportistica dettagliata. Al momento anche ChatGPT ha introdotto la possibilità di caricare documenti di cui terrà memoria nelle sue chat quindi è uno scontro tra giganti.
Tuttavia, presenta alcune limitazioni significative: il supporto linguistico è prevalentemente incentrato sull’inglese, limitando l’usabilità in contesti multilingue. Inoltre, le policy di data retention sollevano preoccupazioni sulla privacy, poiché le conversazioni possono essere archiviate e utilizzate per l’addestramento dei modelli per un periodo fino a tre anni, potenzialmente compromettendo la riservatezza dei dati degli utenti.
La scelta tra ChatGPT e Gemini dipende dalle esigenze specifiche dell’utente. ChatGPT è ideale per chi cerca una soluzione versatile per compiti creativi e conversazionali, mentre Gemini potrebbe risultare indicato per chi ha bisogno di strumenti integrati per la produttività e la gestione dei dati, pur non trascurando la pessima esperienza che abbiamo ottenuto con Google ADS.
Il nostro consiglio di base è che se siete disposti a testare Gemini nella versione pro a pagamento con l’idea di continuare a pagare se vi troverete bene, vi invitiamo sicuramente a provarlo, poichè solo in quel caso potrete avere un confronto alla pari con ChatGPT. Se invece siete utenti che si accontentano delle versioni gratuite o limitate per un utilizzo non professionale e continuativo… lasciate perdere Gemini perchè anche se non vi pone limiti di utilizzo nella versione gratuita, al momento a nostro avviso il modello base e inferiore sulla maggiorparte dei fronti.



