Presentazione Veo 3

Google ha recentemente lanciato Veo 3, il suo generatore di video AI più avanzato, durante la conferenza Google I/O 2025. Il sistema ha stupito per la capacità di creare video iperrealistici con audio sincronizzato, alzando l’asticella nella generazione video tramite intelligenza artificiale. Veo 3 è accessibile tramite Gemini, la piattaforma AI di Google, ma al momento il suo utilizzo è limitato a un numero selezionato di utenti. Le sue funzionalità sono state progettate per offrire una resa visiva di altissima qualità. L’interesse crescente verso questa tecnologia conferma l’impegno di Google nel competere con i leader del settore AI video.

Come funziona e cosa si può fare con Veo 3?

Veo 3 è il nuovo editor video AI di Google, capace di generare video iperrealistici simili a veri film partendo da un semplice prompt testuale. L’utente non ha bisogno di competenze di video-editing: basta descrivere la scena nei dettagli, ambienti, personaggi, situazion, e Veo 3 la trasforma in un video realistico, completo di audio sincronizzato automaticamente. Le clip possono durare fino a 8 secondi e spaziare tra vari stili: trailer, meme, contenuti emotivi o creativi. La qualità è garantita da Google ed è confermata dai primi esperimenti condivisi dagli utenti. Il tool è accessibile tramite Gemini, l’app AI di Google, disponibile su dispositivi iOS e Android, anche se l’accesso è attualmente limitato a specifici abbonamenti e località. Veo 3 si posiziona così come uno strumento innovativo e versatile per creator, marketer e professionisti, offrendo nuove possibilità di narrazione visiva senza richiedere abilità tecniche avanzate.

Chi può utilizzare Veo 3?

Google ha annunciato, tramite un post su X, l’avvio della distribuzione di Veo 3 in 71 Paesi, tra i quali non è presente l’Italia e il resto d’Europa, così come il Regno Unito. Il motivo è da ricercare nelle normative più stringenti che il vecchio continente applica alle piattaforme di intelligenza artificiale. Gli utenti nei Paesi non ancora abilitati possono continuare a utilizzare Veo 2, tuttavia Google sta cercando di estendere progressivamente l’accesso a più nazioni. Attualmente, Veo 3 è disponibile solo per gli abbonati al piano Google AI Ultra, che costa 249,99 dollari al mese e prevede limiti giornalieri di generazione video. Gli utenti Ultra possono accedere anche alla modalità Flow, specifica per la generazione video avanzata. Gli abbonati a Gemini AI Pro possono comunque provare Veo 3 tramite un pacchetto di prova una tantum. L’espansione del servizio prosegue gradualmente, con l’obiettivo di rendere la tecnologia disponibile a un pubblico sempre più ampio.

La nuova rivoluzione

Al centro dell’attuale rivoluzione tecnologica c’è la computer vision, una branca dell’intelligenza artificiale che permette ai computer di “vedere” e comprendere immagini e video. Per un algoritmo, vedere non significa solo registrare, ma interpretare ciò che osserva: riconoscere oggetti, seguirne i movimenti, analizzare gesti e persino intuire le relazioni all’interno di una scena. Questo processo richiede enormi quantità di dati e potenza di calcolo, poiché le macchine devono apprendere da zero ciò che per l’uomo è istintivo. Per affrontare questa sfida sono nate le reti neurali convoluzionali, modelli ispirati alla struttura della corteccia visiva umana, capaci di elaborare milioni di immagini e apprendere a riconoscere la realtà visiva con sempre maggiore precisione.

Perplessità e allarmismo

Veo 3 sta rapidamente guadagnando popolarità sui social grazie a clip di sorprendente realismo visivo e sonoro, spesso indistinguibili da quelle reali. Questa tecnologia di nuova generazione supera il confine del verosimile, suscitando non solo entusiasmo, ma anche preoccupazioni crescenti. La capacità di creare video così realistici apre infatti la porta a potenziali usi distorti, in particolare nella diffusione di fake news e contenuti manipolati. Proprio per questo, diventa sempre più urgente adottare strumenti di tracciabilità e trasparenza, come filigrane digitali e etichettature AI-native, per proteggere l’informazione e garantire l’affidabilità delle fonti in un contesto dove realtà e finzione rischiano di confondersi pericolosamente.

Come si creano i deepfake?

I deepfake si realizzano scomponendo un video in migliaia di fotogrammi, su cui si identificano elementi chiave come volto, occhi, mani e bocca. Il volto viene poi sostituito e sincronizzato con un audio falso, creando l’illusione che una persona dica o faccia qualcosa mai avvenuto. Alla base di questa tecnologia ci sono le GAN (Generative Adversarial Network), due reti neurali in competizione: una crea contenuti, l’altra li valuta. Il processo si ripete finché il risultato appare del tutto credibile e realistico.

Come viene applicata nella vita reale?

La computer vision ha ormai pienamente contaminato la nostra realtà. La si può trovare, ad esempio, nei supermercati Amazon Go, dove le videocamere riconoscono i prodotti messi nel carrello. Nelle auto che monitorano l’attenzione del conducente o nei sistemi aeroportuali di riconoscimento facciale. E ancora, nella medicina per l’analisi delle radiografie, nella moderazione dei contenuti sui social, nel settore militare per distinguere civili da combattenti. O per la creazione di interi film, senza la necessità di impiegare attori in carne e ossa, ma solo servendosi della tecnologia. Oggi esistono sistemi in grado di rilevare i deepfake, come quelli sviluppati da Facebook e Google. Ma sono costosi, lenti e inefficaci su larga scala. Il paradosso è evidente: la stessa Gan usata per generare falsi può essere rieducata per aggirare i rilevatori. È una corsa agli armamenti digitali in cui vince chi ha più dati, più tempo e più potenza computazionale.

In conclusione

Veo 3 rappresenta un’enorme evoluzione nella generazione video tramite AI, ma solleva interrogativi importanti. Se da un lato apre nuove strade alla creatività e all’innovazione, dall’altro alimenta il rischio di disinformazione tramite deepfake sempre più realistici. In un mondo dove realtà e finzione si confondono, sarà fondamentale affiancare a questi strumenti sistemi di controllo etici e tecnologici per garantire trasparenza e tutela dell’informazione.

Facciamo due chiacchiere?

Siamo a Pesaro.

Scrivici qui sotto per mandarci un messaggio.


    La tua social agency