Jeudi, la société OpenAI, qui a créé ChatGPT, a présenté un nouveau modèle d'intelligence artificielle qui convertit le texte en vidéo. Ce modèle s'appelle Sora. L'introduction ne comprenait qu'un petit nombre de démonstrations vidéo initiales. Les analystes de Macquarie décrivent Sora comme une "nouvelle technologie révolutionnaire".
L'introduction présente plusieurs vidéos d'une durée de 60 secondes chacune. OpenAI affirme que ces vidéos ont été générées "directement par Sora sans aucune altération".
Avec l'introduction de Sora, l'entreprise d'IA "a une fois de plus démontré que son développement de produits en interne fait avancer les frontières de la technologie et que ses produits établissent souvent de nouvelles références en matière de technologie de pointe", selon les analystes de Macquarie dans leur rapport.
"Nous pensons que la capacité de créer des vidéos cohérentes d'une longueur significative et la compréhension par le modèle de la façon dont les objets existent et interagissent dans l'espace tridimensionnel sont deux avancées majeures introduites avec cette version de la technologie", ont-ils ajouté.
Les analystes ont identifié trois points importants à retenir de la sortie de Sora.
Premièrement, elle illustre les dangers de la création de startups qui s'appuient sur des modèles uniques pour obtenir un avantage concurrentiel, en particulier avec la montée en puissance de nouvelles entreprises bien capitalisées.
Deuxièmement, le rythme auquel l'IA générative peut transformer les industries créatives, comme la production vidéo, pourrait être plus rapide que ce qui avait été estimé précédemment.
Troisièmement, Macquarie suggère que l'issue du procès sur les droits d'auteur intenté par le New York Times sera cruciale. Elle estime qu'il est essentiel d'observer ce procès pour comprendre comment les systèmes juridiques pourraient appliquer les lois sur les droits d'auteur aux entreprises d'IA générative. Cela affectera probablement la vitesse de développement des modèles d'IA tels que Sora, qui nécessitent vraisemblablement de nombreuses données médiatiques pour leur formation.
Cet article a été créé et traduit avec l'aide de l'IA et revu par un rédacteur. Pour plus de détails, consultez nos conditions générales.