Vous vous souvenez du plaisir enfantin de construire une haute tour avec des cubes (que ce soit de simples cubes en bois ou des Kapla) ?

Imaginez que vous et vos camarades du bac à sable meniez une compétition acharnée pour savoir qui peut empiler le plus de cubes et atteindre la tour la plus haute. Vous menez une compétition acharnée avec vos camarades en bavoir pour savoir qui peut empiler le plus haut. Vous êtes le roi des constructeurs. Docteur ès Cubes !

Imaginez maintenant que, alors que vous êtes reconnu par vos pairs vous apercevez une photo de la pyramide de Gizeh. Et que vous, malgré votre bas âge, ayez assez d’intellect pour comprendre la complexité incroyable de cette construction monumentale, qui est d’un tout autre niveau.

Cette madeleine de Proust vous permet de mieux appréhender le séisme qu’a provoqué hier dans la communauté des amateurs de vidéos d’IA la découverte de Sora, le nouveau programme d’OpenAI. En effet, Sora franchit un palier technologique considérable : Creating video from text.

The New York Times :

OpenAI Unveils A.I. That Instantly Generates Eye-Popping Videos, le 15 février 2024.

Pour résumer le contexte : depuis un an, une importante communauté en ligne cherche à exploiter le potentiel de la création de vidéos par IA, notamment via Stable Diffusion. Jusqu’à présent, on savait :

– Créer une vidéo à partir d’une autre vidéo (vid2vid) très complexe mais le plus stable

– Animer une image fixe (img2video)

– Générer de courtes vidéos à partir de texte (txt2video)

Et cela est/était déjà une révolution !

voir Runaway.



+

En illustration, voici les lauréats du prix du film généré par AI du mois dernier organisé par Runway :

A conversation about the future of film



Watch the full collection of winning films from the second edition of GEN:48

Mais les limites sont importantes : temps de calcul, matériel insuffisant, stabilité et durée des vidéos perfectibles (généralement, on ne pouvait produire que 2 à 4 secondes d’animation de qualité aléatoire).

D’où le choc en découvrant Sora : des animations réalistes, stables, de grande qualité et de longue durée. Une prouesse qui change la donne ! Donc vous comprendrez que quand on voit ça, généré uniquement à partir de texte text2vid, d’une telle stabilité, d’un tel réalisme, et d’une si grande durée, c’est pour beaucoup le signal qu’un morceau important de la banquise qui vient de se séparer.

Sora by openAI looks incredible (txt to video)

Pour la première fois, on peut générer une longue animation de qualité époustouflante uniquement à partir d’un simple prompt ! C’est une avancée majeure.

La démonstration de Sora change totalement la donne. Aussi bien pour le grand public que les industries et professionnels ayant recours à l’audiovisuel.

Une avancée comparable à l’invention de l’imprimerie de Gutenberg ?

Un moment de ceux où on comprend que le monde d’hier a disparu.

Je comprends un peu mieux les nostalgiques d’un passé, déjà fantasmé, qu’ils pensent à jamais perdu. Apeurés par un futur qui frappe à leur porte et dont le bruit des talons semble indiquer qu’il a oublié de leur garder une place autour de la table du festin. Maudit sois-tu Chronos !

« Il faut laisser du temps au temps » disait hier encore ce Chancelier allemand.