El modelo generador de videos, Sora, presentado recientemente por OpenAI, no solo marca su debut, sino que también redefine los límites conocidos del cinematográfico digital. Lo que inicialmente se reveló sobre Sora apenas roza la superficie, como demuestra un artículo técnico publicado hace horas.

Sora y su versátil arquitectura
El estudio, «Modelos de generación de video como simuladores de mundos», coescrito por un equipo de investigadores de OpenAI, descubre facetas cruciales de la arquitectura de Sora, como su capacidad para generar videos de resolución y proporción variada (hasta 1080p).
Según el documento, Sora es idóneo para una variedad de tareas de edición de imagen y video, desde la creación de videos en bucle hasta la ampliación de videos en el tiempo y la modificación de fondos.
Un simulador de mundos digitales
Sin embargo, lo que más atrae la atención es la habilidad de Sora para «simular mundos digitales». En una prueba, OpenAI introdujo en Sora comandos que incluían la palabra «Minecraft», resultando en la generación de una interfaz y un juego que no desentonaría en el universo de Minecraft, incluyendo dinámicas de juego realistas y física avanzada, controlando además al personaje del jugador.
¿Qué hace posible la magia de Sora?
Como lo señala Jim Fan, investigador senior de Nvidia, Sora se comporta más como un «motor de física basado en datos» que como una simple herramienta creativa. No solo genera una foto o video, sino que determina la física de cada objeto en un entorno — y renderiza una foto, video (o mundo 3D interactivo, si así se desea) con base en estos cálculos.
«Estas capacidades indican que continuar la escalabilidad de los modelos de video representa un camino prometedor hacia el desarrollo de simuladores altamente capaces del mundo físico y digital, y de los objetos, animales y personas que habitan en ellos», escriben los coautores de OpenAI.

Limitaciones y Futuro de Sora en los Videojuegos
Ahora bien, las limitaciones habituales de Sora también se aplican al dominio de los videojuegos. El modelo no puede simular con precisión la física de interacciones básicas como el rompimiento de vidrio, y aunque en ocasiones puede modelar interacciones, a menudo resulta inconsistente — por ejemplo, podría renderizar a una persona comiendo una hamburguesa, pero sin marcas de mordidas. —
Aun así, y si comprendiendo bien el documento, Sora podría ser el precursor de juegos generados de manera procedimental más realistas —incluso fotorrealistas— a partir de simples descripciones de texto. Esto resulta tan emocionante como aterrador (pensemos en las implicaciones de los deepfakes), y probablemente por eso OpenAI opta por ofrecer el acceso a Sora solo a través de un programa extremadamente limitado por el momento.
Esperamos ansiosamente aprender más sobre este impresionante avance. Tal vez, con suerte, antes de lo que pensamos.