Sora: OpenAI lanza una herramienta que crea instantáneamente videos a partir de texto

0
162

El modelo del fabricante ChatGPT ‘simula el mundo físico en movimiento’ durante hasta un minuto de duración según el tema y las instrucciones de estilo de los usuarios.

The Guardian.- OpenAI reveló una herramienta el jueves que puede generar videos a partir de indicaciones de texto.

El nuevo modelo, apodado Sora por la palabra japonesa que significa “cielo”, puede producir imágenes realistas de hasta un minuto de duración que siguen las instrucciones del usuario tanto en el tema como en el estilo. Según una publicación de blog de la compañía, la modelo también puede crear un video basado en una imagen fija o ampliar el metraje existente con material nuevo.

“Estamos enseñando a la IA a comprender y simular el mundo físico en movimiento, con el objetivo de entrenar modelos que ayuden a las personas a resolver problemas que requieren interacción con el mundo real”, se lee en la publicación del blog.

Un vídeo incluido entre varios ejemplos iniciales de la empresa se basó en el mensaje: “Un tráiler de película que presenta las aventuras del hombre espacial de 30 años que lleva un casco de motocicleta tejido de lana roja, cielo azul, desierto de sal, estilo cinematográfico, toma en película de 35 mm, colores vivos”.

La compañía anunció que había abierto el acceso a Sora a algunos investigadores y creadores de videos. Los expertos crearían un “equipo rojo” para el producto: lo probarían para determinar su susceptibilidad a eludir los términos de servicio de OpenAI, que prohíben “la violencia extrema, el contenido sexual, las imágenes de odio, la imagen de celebridades o la propiedad intelectual de otros”, según la publicación del blog de la compañía. La compañía solo permite un acceso limitado a investigadores, artistas visuales y cineastas, aunque el director ejecutivo Sam Altman respondió a las solicitudes de los usuarios en Twitter después del anuncio con videoclips que, según dijo, fueron hechos por Sora. Los videos llevan una marca de agua para mostrar que fueron creados por IA.

La compañía presentó el generador de imágenes fijas Dall-E en 2021 y el chatbot generativo de IA ChatGPT en noviembre de 2022, que rápidamente acumuló 100 millones de usuarios. Otras empresas de inteligencia artificial han presentado herramientas de generación de vídeo, aunque esos modelos sólo han podido producir unos pocos segundos de metraje que a menudo tienen poca relación con sus indicaciones. Google y Meta han dicho que están en el proceso de desarrollar herramientas de vídeo generativo, aunque no las han hecho públicas. El miércoles, anunció un experimento para agregar una memoria más profunda a ChatGPT para poder recordar más chats de sus usuarios.

OpenAI no reveló cuántas imágenes se utilizaron para entrenar a Sora o dónde se pudieron haber originado los videos de entrenamiento, aparte de decirle al New York Times que el corpus contenía videos que estaban disponibles públicamente y con licencia de los propietarios de los derechos de autor. La compañía ha sido demandada varias veces por presunta infracción de derechos de autor en el entrenamiento de sus herramientas de inteligencia artificial generativa, que digieren cantidades gigantescas de material extraído de Internet e imitan las imágenes o el texto contenidos en esos conjuntos de datos.

Compartir en:

Leave a reply