Los investigadores de Microsoft introdujeron un nuevo modelo de inteligencia synthetic (IA) el miércoles que puede generar entornos de juego 3D. Apodado el Modelo de Acción World and Human (WHAM) o Muse, el nuevo modelo de IA fue desarrollado por la inteligencia de los juegos de investigación del gigante tecnológico y las experiencias de IA enseñables (Tai X) en colaboración con la teoría ninja de Xbox Video games Studios. La compañía dijo que el modelo de lenguaje grande (LLM) puede ayudar a los diseñadores de juegos en el proceso de ideación, así como ayudar a generar imágenes de juegos y acciones de controlador para ayudar a los creativos en el desarrollo de juegos.
Microsoft presenta el modelo Muse AI
En blogel gigante tecnológico con sede en Redmond detalló el modelo Muse AI. Este es un producto de investigación actualmente, aunque la compañía dijo que está abierta los pesos y los datos de muestra del modelo para el demostrador WHAM (un prototipo conceptual de una interfaz visible para interactuar con el modelo AI). Los desarrolladores pueden probar el modelo en Azure Ai Foundry. A papel Detallando los aspectos técnicos del modelo se publica en The Nature Journal.
Entrenar un modelo en un área tan compleja es una propuesta difícil. Los investigadores de Microsoft recopilaron una gran cantidad de datos de juego humano del juego 2020 Bleeding Edge, un juego publicado por Ninja Concept. El LLM fue entrenado en mil millones de parejas de acción de imagen, que es equivalente a siete años de juego humano. Se cube que los datos se recopilan éticamente y se usan solo para fines de investigación.
Los investigadores dijeron que ampliar la capacitación del modelo period un gran desafío. Inicialmente, Muse fue entrenado en un grupo de GPU NVIDIA V100, pero luego se escaló a múltiples GPU NVIDIA H100.
Al llegar a la funcionalidad, el modelo Muse AI acepta indicaciones de texto, así como entradas visuales. Además, una vez que se genera un entorno de juego, se puede mejorar aún más utilizando acciones del controlador. La IA responde a los movimientos realizados por el usuario para representar nuevos entornos alineados con el aviso inicial y consistente con el resto del juego.
Debido a ser un modelo de IA único, las pruebas de referencia típicas no pueden evaluar adecuadamente sus capacidades. Los investigadores destacaron que han probado internamente el LLM sobre métricas como la consistencia, la diversidad y la persistencia. Dado que es un modelo centrado en la investigación, las salidas se han limitado a solo una resolución de 300x180p.