La mia esperienza iniziale con Gemini Advanced di Google

Gemini Ultra vs. GPT-4: Google ha battuto GPT-4 questa volta? 

Gli aspetti positivi, negativi e inaspettati di Gemini Ultra.

 

Google ha appena rilasciato Gemini Advanced, alimentato dal suo modello di intelligenza artificiale più capace, Gemini Ultra. Sì, è lo stesso modello che qualche mese fa ha battuto GPT-4 nei test di benchmark. Ora abbiamo l’opportunità di vedere noi stessi se è effettivamente migliore di GPT-4. In questo articolo, esamineremo i lati positivi e negativi di Gemini Ultra confrontandolo con GPT-4. Va specificato che l’ho provato in America, molte funzionalità che cito nell’articolo, come la generazione delle immagini, non è disponibile in Google Gemini Advanced al momento.

 

Il lato positivo di Gemini Ultra
Velocità
Quando si tratta di velocità,
nella maggior parte dei test Gemini è più veloce di GPT-4. Il problema è che Gemini non sempre fornisce risposte adeguate.

 

None

 

Vedremo la qualità delle risposte di Gemini nel resto dell’articolo, ma sì, Gemini è più veloce di GPT-4.

 

App native di Google
Ho usato sia Gemini Ultra che GPT-4 come assistenti personali e ho chiesto loro di aiutarmi a pianificare il mio prossimo viaggio.

 

La prossima settimana parto dalla California per New York. Mostrami voli per New York e hotel vicino a Central Park
Gemini si collega automaticamente alle app di Google come Voli e Hotel per fornire informazioni in tempo reale.

None

 

GPT-4 non dispone di questa funzionalità. Plugin o un GPT con azioni personalizzate potrebbero offrirti qualcosa di simile alle app native di Google. Per impostazione predefinita, GPT-4 risponderà in un modo simile al seguente.

 

None

 

L’inatteso di Gemini Ultra: Immagini realistiche
Le immagini di Gemini sembrano fotografie stock scattate da veri fotografi piuttosto che immagini create con l’IA. A questo proposito, possiamo dire che le immagini di Gemini sono più realistiche (o meno sofisticate) rispetto a DALL-E 3 o Midjourney.

make an image of a programmer learning to code.

None

Tuttavia, a differenza di DALL-E 3, Gemini non migliora il tuo prompt. Se utilizzo lo stesso prompt su ChatGPT, DALL-E 3 genererà un prompt che conferisce all’immagine un aspetto più accattivante.

 

None

Se dovessi scegliere un’immagine per il mio articolo, opterei per quella generata da DALL-E 3 sulla sinistra. Ovviamente si tratta di una preferenza personale. Tuttavia, è innegabile che non sarei mai stato in grado di elaborare il prompt qui sotto, anch’esso generato da DALL-E 3.

“Immagina una scena in cui un giovane programmatore è profondamente immerso nell’apprendimento del codice. L’ambientazione è una stanza accogliente e ben illuminata di notte, piena di oggetti tecnologici: un grande monitor che mostra righe di codice, libri sulla programmazione sparsi intorno e una tazza di caffè fumante sulla scrivania. Il programmatore, in abiti casual, si concentra intensamente sullo schermo, digitando sulla tastiera con uno sguardo determinato e curioso. Note e diagrammi sono appuntati su una bacheca alle sue spalle, a illustrare vari concetti di programmazione. L’atmosfera è di tranquilla dedizione e ricerca della conoscenza.!

Ecco perché penso che DALL-E 3 sia uno strumento prezioso soprattutto per chi è nuovo alla generazione di immagini, o quando si è a corto di creatività. Con un po’ di esperienza nella generazione di immagini, è possibile controllare l’estetica delle immagini di Gemini proprio come faccio io nel prompt qui sotto. In questo modo, le immagini di Gemini sembreranno meno realistiche, cosa che sembra essere l’impostazione predefinita.

Un podio con dei robot al primo, secondo e terzo posto, in stile fumetto della domenica. Non ero soddisfatto delle immagini generate da Gemini, quindi ho chiesto se il robot in prima posizione potesse tenere un trofeo, ed è proprio quello che è successo. 

None

Ora, se sei un esperto nella creazione di prompt dettagliati per le immagini, penso che DALL-E 3 o Midjourney possano essere migliori di Gemini.

 

Testiamo il prompt sottostante con Gemini.

A widescreen landscape style image with an action movie point of view featuring, in the center, a man with a bewildered expression, pushing a shopping cart. The aisle is lined with price tags, but instead of ordinary products, the shelves display a variety of intricate mechanical parts suggesting a surreal or futuristic shopping experience. The perspective should be from the end of the aisle looking towards the entrance. Sunday comics aesthetica

None

Ecco cosa ha generato DALL-E 3.

 

None

In generale, userei Gemini per generare immagini realistiche con un prompt semplice. Per tutto il resto, userei DALL-E 3 o Midjourney.

 

Nota: volevo testare la generazione di immagini in Europa, ma ogni volta che ci ho provato ho ricevuto il messaggio “Non posso ancora creare immagini, quindi non posso aiutarti in questo.” Potrei risolvere ciò passando agli USA con una VPN.

 

I punti negativi di Gemini Ultra

Ragionamento

Ho dato ad entrambi i modelli due esercizi di ragionamento per vedere se potevano ottenere la risposta corretta.

 

Prima, ho iniziato con questo semplice esercizio.

 

Trova il numero successivo nella sequenza: 30, 45, 90, 225, 675, …

 

Gemini ha trovato rapidamente la risposta, ma era sbagliata.

 

None

Detto questo, quando ho cliccato su “mostra bozze” ho scoperto che la bozza numero 3 conteneva la risposta giusta. Quindi possiamo dire che ci è riuscita al terzo tentativo.

 

GPT-4 ha impiegato più tempo, ma ha trovato la risposta giusta al primo tentativo.

 

None
Il secondo esercizio era più sfidante:

Solve this exercise:

LOO, MON, NOM, OOL, ____

A. POK B. HOL C. HOK D. JOI

Le tre bozze iniziali di Gemini erano sbagliate, quindi ho chiesto di nuovo e ho ottenuto la risposta corretta nella bozza 3.

 

None

Dall’altra parte, GPT-4 ha fallito la prima volta, ma ha trovato la risposta corretta al secondo tentativo.

 

In generale, GPT-4 è migliore nel ragionamento rispetto a Gemini.

 

Generazione di codice

 

Entrambi i modelli sono bravi a spiegare il codice, ma quando si tratta di generare codice, sembra che Gemini abbia alcune limitazioni imposte da Google.

 

Se vogliamo creare un gioco “Snake”, Gemini genera il codice e puoi persino esportarlo su Colab con un solo clic.

 

None

Ma quando provi a generare altri tipi di script, inizia a generare il codice e improvvisamente si ferma e mostra il messaggio qui sotto.

None

Cercando su internet, ho scoperto che alcuni YouTuber hanno riscontrato gli stessi problemi con Gemini non solo nella generazione di codice ma anche nella spiegazione del codice.

 

Questo non mi è mai successo con GPT-4, quindi direi che GPT-4 supera Gemini Ultra nella programmazione.

 

Ecco fatto! Non ho confrontato funzionalità come la lettura di PDF o l’analisi di dataset perché al momento Gemini non supporta il caricamento di file diversi dalle immagini. Inoltre, questa volta non ho effettuato un test sulla creatività perché è un po’ soggettivo, quindi lascio a voi ulteriori prove sul “campo”!

Gabriele Ferrari

Via Cesare Costa,88
41123 – Modena
Nato il 10/06/1968
Tel. +39 3357682392
P.IVA 03615520362
E-mail: gabriele@gabrieleferrari.net

Web Designer, Digital Project Manager, Esperto di WordPress, Sviluppatore Web, Esperto Certificato di Google Ads, Social Media Manager e Graphic Designer attualmente lavora come libero professionista. Fornisce servizi quali consulenza, sviluppo di siti web, SEO e pubblicità online, marketing sui social media, grafica e sviluppo di app mobile per aziende e privati. Precedente esperienza come Web Project Manager e Social Marketing Manager in importanti agenzie web, nonché Family Banker e Team Manager nel settore dei giochi. Laureato presso la facoltà di Ingegneria Elettronica dell’Università di Bologna.