Vous aurez bientôt l’occasion d’essayer par vous-mêmes le générateur de texte en vidéo Sora d’OpenAI. Dans une entrevue avec le Wall Street Journal, la directrice technique d’OpenAI, Mira Murati, a dit que Sora sera disponible cette année et que cela ne prendra que quelques mois.
Sora est capable de générer des scènes hyperréalistes basées sur une invite de texte. Cet outil d’IA générative a été dévoilé par OpenAI en février. La société n’a rendu l’outil disponible qu’aux artistes visuels, designers et cinéastes pour commencer, mais cela n’a pas empêché certaines vidéos générées par Sora de se retrouver sur les réseaux sociaux comme X.
En plus de rendre l’outil disponible au public, Murati dit qu’OpenAI a l’intention d’éventuellement incorporer du son, ce qui a le potentiel de rendre les scènes encore plus réalistes. La société veut également permettre aux utilisateurs de modifier le contenu des vidéos que Sora produit, car les outils d’IA ne créent pas toujours des images précises. «Nous essayons de comprendre comment utiliser cette technologie comme un outil avec lequel les gens peuvent éditer et créer», dit Murati au WSJ.
Une IA sûre?
Lorsqu’on lui a demandé quelles données OpenAI avait utilisées pour entraîner Sora, Murati n’a pas été très précise et a semblé esquiver la question. «C’était des données disponibles publiquement ou sous licence», assure-t-elle. Murati dit aussi qu’elle n’est pas sûre si elle a utilisé des vidéos de YouTube, Facebook et Instagram. Elle a seulement confirmé au Journal que Sora utilise du contenu de Shutterstock, avec lequel OpenAI a un partenariat.
Murati a également dit au Journal que Sora est «beaucoup plus coûteux» à alimenter. OpenAI essaie de rendre l’outil «disponible à des coûts similaires» à Dall-E, le modèle de texte en image de l’entreprise, lorsqu’il sera rendu public. Vous pouvez voir encore plus d’exemples de ce que cet outil peut produire dans le rapport du Journal, y compris un taureau animé dans un magasin de porcelaine et un critique de smartphones sirène.
À mesure que de nouveaux outils d’IA comme Sora apparaissent, les préoccupations concernant les outils d’IA génératifs et leur potentiel pour créer de la désinformation augmentent. Lors de sa sortie, Murati dit que Sora ne sera probablement pas capable de produire des images de personnalités publiques, à l’instar des politiques de Dall-E. Les vidéos auront également un filigrane pour les distinguer de la réalité, ce qui n’est toutefois pas une solution parfaite, selon les experts.