VIDEO: Así es Sora de OpenAI, capaz de crear videos instantáneos a partir de texto

La empresa tecnológica estadounidense OpenAI, creadora de ChatGPT, reveló el jueves una herramienta que puede generar videos a partir de indicaciones de texto.

"Presentamos a Sora, nuestro modelo de texto a video. Sora puede crear videos de hasta 60 segundos con escenas muy detalladas, movimientos de cámara complejos y múltiples personajes con emociones vibrantes", explicó OpenAI en un tuit.

Además, la publicación presenta un ejemplo de video generado con las siguientes indicaciones: "La hermosa y nevada ciudad de Tokio está muy animada. La cámara se mueve por las bulliciosas calles de la ciudad, siguiendo a varias personas disfrutando del hermoso clima nevado y comprando en los puestos cercanos. Preciosos pétalos de sakura vuelan con el viento junto con los copos de nieve".

Según la descripción que se brinda en la página oficial de la empresa, donde muestra más imágenes creadas con la aplicación, Sora "es capaz de generar escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos del sujeto y el fondo". Asimismo, la herramienta "comprende no solo lo que el usuario ha pedido en el mensaje, sino también cómo existen esas cosas en el mundo físico".

Detalles por mejorar

Sin embargo, la herramienta tiene ciertas debilidades. "Por ejemplo, una persona puede darle un mordisco a una galleta, pero después, es posible que la galleta no tenga la marca del mordisco", señala la empresa.

"El modelo también puede confundir los detalles espaciales de un mensaje, por ejemplo, mezclando izquierda y derecha, y puede tener dificultades con descripciones precisas de eventos que tienen lugar a lo largo del tiempo, como seguir una trayectoria de cámara específica", añade.

Acerca de la seguridad, OpenAI asevera que antes de que Sora esté disponible para los usuarios, se tomarán varias medidas importantes. Así, un clasificador de texto especial rechazará las solicitudes de "violencia extrema, contenido sexual, imágenes de odio, imágenes de celebridades" y otros.

Por ahora, el acceso se otorga solo a "una serie de artistas visuales, diseñadores y cineastas para obtener comentarios sobre cómo mejorar el modelo para que sea más útil para los profesionales creativos", explica la compañía.