Midjourney lancia “text‑to‑video”: i cinque punti chiave
-
Evoluzione naturale dal “text‑to‑image” al video
Midjourney, già celebre per la generazione di immagini da testo, inaugura ora una tecnologia che trasforma prompt testuali in brevi video. Si tratta di un significativo salto tecnologico, perché richiede gestire continuità visiva e movimento tra i fotogrammi. -
In parallelo con Veo 3 di DeepMind
A poche settimane dal lancio di Veo 3 di Google, specializzato in video 4K con fisica avanzata, Midjourney propone la sua versione video, arricchita dal riconoscibile stile visivo e dall’ecosistema già consolidato. -
Accesso graduale in beta
Non è chiaro se l’accesso sarà aperto o riservato in fase iniziale. Tuttavia, è probabile che il rilascio segua lo stesso approccio adottato per le immagini: fasi sperimentali per creator e partner, prima del rollout pubblico. -
Sfide tecniche importanti
A differenza delle immagini statiche, nella generazione video è cruciale garantire fluidità tra i fotogrammi, transizioni coerenti e rispetto delle leggi fisiche degli oggetti in movimento. Tutto ciò richiede capacità algoritmiche e capacità computazionali molto avanzate. -
Potenziale impatto creativo e commerciale
L’arrivo di strumenti “text‑to‑video” efficaci può rivoluzionare storytelling, pubblicità, entertainment e social media. Se Midjourney riuscirà a bilanciare estetica, semplicità d’uso e costi competitivi, potrebbe diventare un attore di riferimento in questo settore emergente.
Dettagli dal blog ufficiale (V1 Video Model)
-
Il modello video debutta con la modalità “Image‑to‑Video”: partendo da un’immagine Midjourney, basta cliccare su “Animate” per generare quattro video di circa 5 secondi cad.
-
Sono disponibili modalità automatiche e manuali: la prima fa muovere la scena in modo generico, la seconda consente di descrivere il movimento desiderato. Si può scegliere tra “high motion” e “low motion”.
-
I video possono essere estesi di 4 secondi per segmento, fino a un massimo di 21 secondi totali.
-
Il servizio sarà inizialmente web-only via Discord, con un prezzo stimato circa 8 volte superiore rispetto a un’immagine singola: il modello base costa 10 $/mese e offre un costo paragonabile all’upscale di un’immagine, circa 1 $/sec.
-
Obiettivo strategico: dopo le immagini e i video, Midjourney punta a modelli 3D e simulazioni in tempo reale.
Midjourney compie un passo significativo con l’introduzione della generazione video da testo e da immagini. Nonostante le sfide tecniche (continuità, fisica, risoluzione), l’azienda punta su accessibilità e forte impatto creativo. Se riuscirà a mantenere la qualità visiva, semplicità d’uso e valori competitivi, potrebbe ritagliarsi un ruolo di primo piano in un mercato in rapida crescita.









