Ora Google Gemini sa anche ascoltare

Google prosegue inarrestabile la sua corsa nel settore dell’intelligenza artificiale. Proprio in queste ore, infatti, la compagnia ha rilasciato un aggiornamento al suo Gemini 1.5 Pro, aggiungendo al modello la capacità di ascoltare i file audio caricati dagli utenti, elaborarli e poi fornire loro le risposte adeguate – senza la necessità di dover ricevere obbligatoriamente un prompt di testo -. Ma questa non è la sola novità annunciata dal colosso tecnologico in occasione del suo evento Google Next. A quanto pare, a breve la nuova versione di Gemini sarà resa disponibile al pubblico per la prima volta, attraverso la sua piattaforma per mettere a punto app AI, Vertex AI.

Un aggiornamento importante, che porta Gemini 1.5 Pro a superare il modello più performante messo a punto di recente da Big G, Gemini Ultra. Eppure, quello che stupisce è che non si tratta della sola AI di Google ad aver ricevuto un aggiornamento. Di recente, infatti, anche il modello text-to-image Imagen 2 ha visto l’integrazione delle nuove funzionalità di inpainting e outpainting, che consentono agli utenti di aggiungere o rimuovere elementi dalle immagini. Anzi, a questo Google ha aggiunto di recente anche la funzione SynthID, in grado di applicare alle immagini generate dall’AI una filigrana invisibile allo spettatore, ma ben riconoscibile ai sistemi di rilevamento.

Insomma, è evidente che Big G stia cercando di migliorare quanto più possibile le prestazioni dei suoi modelli, così da fornire a utenti e sviluppatori un’esperienza esaustiva, convincendoli ad optare per Gemini e Imagen piuttosto che per ChatGpt e Dall-E. Proprio di recente, per esempio, la compagnia ha annunciato la sua volontà di integrare l’AI nel motore di ricerca, così da ottimizzarne le funzionalità. La direzione di Google, quindi, è chiara: puntare tutto sull’intelligenza artificiale. Non dovremmo stupirci, allora, se a breve Gemini riuscirà anche a parlare alla perfezione.

Fonte : Wired