Cosa è Gemini Live?
Google ha recentemente lanciato Gemini Live, una nuova funzione di chat vocale AI che si propone di competere direttamente con la modalità di chat vocale avanzata di ChatGPT.
Google ha recentemente lanciato Gemini Live, una nuova funzione di chat vocale AI che si propone di competere direttamente con la modalità di chat vocale avanzata di ChatGPT. La presentazione di questa innovazione è avvenuta durante l’evento Pixel 9, in cui è stata introdotta la nuova serie di smartphone Pixel 9, caratterizzata da un forte focus sulle funzionalità AI integrate. Tra queste, si distinguono i riassunti delle chiamate, l’integrazione con servizi come Google Calendar, Gmail e G-drive, la riprogettazione delle foto e gli aggiornamenti meteo.
Gemini Live è stato progettato per offrire conversazioni naturali e fluide, ed è ora disponibile per tutti gli utenti avanzati di Gemini. In contrasto, la funzione vocale di OpenAI è ancora limitata a un gruppo ristretto di tester. Gemini Live mette a disposizione 10 diverse voci, tra cui Lyra, Ursa, Capella e Orbit, tutte sviluppate con l’aiuto di attori professionisti. Per evitare problemi di copyright, come quelli che OpenAI ha incontrato con la voce “Sky” associata a Scarlett Johansson, Google ha limitato la funzione a queste voci, impedendo la riproduzione di canzoni o l’imitazione di altre voci.
Questa nuova funzione di chat vocale risponde rapidamente alle domande, gestisce le interruzioni, consente di mettere in pausa e riprendere le conversazioni in un secondo momento, e memorizza le chat precedenti per riprendere il discorso da dove era stato interrotto. Tutto ciò avviene senza la necessità di un’attivazione manuale, poiché Gemini Live può operare in background anche quando il telefono è bloccato.
Durante una dimostrazione, Gemini Live ha mostrato la sua capacità di comprendere e rispondere a richieste complesse, come quella di trovare “cantine adatte alle famiglie vicino a Mountain View con aree all’aperto e parchi giochi nelle vicinanze”, compito che altri assistenti vocali come Siri avrebbero difficoltà a gestire. Tuttavia, nonostante le sue avanzate capacità, Gemini Live non è ancora in grado di comprendere l’intonazione emotiva, un aspetto su cui la funzione vocale di OpenAI è già avanti. Inoltre, la funzione non è ancora in grado di interpretare e utilizzare video per completare compiti complessi, una caratteristica che Google ha promesso di introdurre prossimamente, come annunciato durante la conferenza degli sviluppatori I/O di maggio.
Articoli correlati
ChatGPT: la rivoluzione creativa
OpenAI ha recentemente annunciato un’importante evoluzione del suo modello di punta: GPT-4o ora include la generazione di immagini direttamente integrata nella chat. Noi di Orma Strategie Digitali abbiamo esplorato in profondità questa innovazione tecnologica e vogliamo condividere con te tutti i dettagli su come questa novità può rivoluzionare il tuo approccio creativo e digitale. GPT-4o: […]
Le migliori App gratuite ChatGPT per aumentare la produttività
L’intelligenza artificiale, in particolare ChatGPT di OpenAI, è diventata uno strumento indispensabile per migliorare l’efficienza lavorativa. Ecco alcune delle migliori estensioni gratuite di Chrome che sfruttano ChatGPT per aumentare la tua produttività. 1. ChatGPT writer: automazione delle Email Rispondere alle email può essere tedioso. L’estensione ChatGPT Writer automatizza questo processo, generando risposte professionali e ben […]