la ia aprende a jugar minecraft

La IA aprende a jugar a Minecraft viendo vídeos

Open AI ha entrenado una red neuronal para jugar a Minecraft mediante el preentrenamiento de vídeo (VPT) en un enorme conjunto de datos de vídeo no etiquetados de juegos humanos de Minecraft, mientras que utiliza sólo una pequeña cantidad de datos de contratistas etiquetados.

Con un poco de ajuste, la empresa de investigación y despliegue de IA confía en que su modelo pueda aprender a elaborar herramientas de diamante, una tarea que suele llevar a los humanos competentes más de 20 minutos (24.000 acciones). Su modelo utiliza la interfaz humana nativa de pulsaciones de teclas y movimientos de ratón, lo que lo hace bastante general, y representa un paso hacia los agentes generales que utilizan ordenadores.

Un portavoz de la empresa, respaldada por Microsoft, dijo: «Internet contiene una enorme cantidad de información: «Internet contiene una enorme cantidad de vídeos disponibles públicamente de los que podemos aprender. Se puede ver a una persona haciendo una magnífica presentación, a un artista digital dibujando una hermosa puesta de sol y a un jugador de Minecraft construyendo una intrincada casa. Sin embargo, estos vídeos sólo ofrecen un registro de lo que ha sucedido, pero no la forma precisa en que se ha logrado, es decir, no se conoce la secuencia exacta de los movimientos del ratón y las teclas pulsadas.

«Si queremos construir modelos de fundamentos a gran escala en estos dominios, como hemos hecho en el lenguaje con GPT, esta falta de etiquetas de acción plantea un nuevo reto que no está presente en el dominio del lenguaje, donde las «etiquetas de acción» son simplemente las siguientes palabras de una frase».

Para utilizar la gran cantidad de datos de vídeo sin etiquetar disponibles en Internet, Open AI presenta un método novedoso, aunque sencillo, de aprendizaje por imitación semisupervisado: Video PreTraining (VPT). El equipo comienza reuniendo un pequeño conjunto de datos de contratistas en el que registra no sólo sus vídeos, sino también las acciones que realizaron, que en su caso son pulsaciones de teclas y movimientos del ratón. Con estos datos, la empresa puede entrenar un modelo de dinámica inversa (IDM), que predice la acción que se realiza en cada paso del vídeo. Lo más importante es que el IDM puede utilizar información pasada y futura para adivinar la acción en cada paso.

El portavoz añadió: «Esta tarea es mucho más sencilla y requiere menos datos que la tarea de clonación del comportamiento, que consiste en predecir las acciones teniendo en cuenta únicamente los fotogramas de vídeo pasados, lo que requiere inferir lo que la persona quiere hacer y cómo lograrlo. A continuación, podemos utilizar el IDM entrenado para etiquetar un conjunto de datos mucho mayor de vídeos en línea y aprender a actuar mediante la clonación de comportamientos».

Según Open AI, VPT abre el camino para que los agentes aprendan a actuar viendo la gran cantidad de vídeos que hay en Internet.

El portavoz dijo: «En comparación con el modelado generativo de vídeos o los métodos contrastivos, que sólo producirían prejuicios representativos, VPT ofrece la emocionante posibilidad de aprender directamente prejuicios conductuales a gran escala en más dominios que el lenguaje. Aunque sólo experimentamos en Minecraft, el juego es muy abierto y la interfaz humana nativa (ratón y teclado) es muy genérica, por lo que creemos que nuestros resultados son un buen augurio para otros dominios similares, por ejemplo, el uso del ordenador.»

No te pierdas los últimos artículos:

Web Scraping con Python y BeautifulSoup para Principiantes

Bienvenido a esta guía sobre Web Scraping con Python y BeautifulSoup, diseñada especialmente para principiantes. Si estás buscando aprender a extraer datos de sitios web de manera eficiente, seguro que ...

Curso de Python Básico Gratis

Módulo 1: Introducción a Python Nuestra meta principal es que, al final de este curso, tengas una sólida comprensión de los fundamentos de Python y estés listo para crear tus ...

Sistemas Expertos: ¿Qué son y para qué sirven?

Los sistemas expertos representan una rama fascinante de la inteligencia artificial, diseñada para emular la toma de decisiones de un humano experto en un campo particular. Estas herramientas avanzadas combinan ...

La Historia de la Inteligencia Artificial contada en Años

¿Cómo comenzó todo? Echemos un ojo a la historia de la IA a lo largo del tiempo. Desde 1950 hasta 2024. El artículo es largo, usa la tabla de contenidos ...

¿Qué es el meta-aprendizaje?

El mundo de la Inteligencia Artificial (IA) está en constante evolución, y una de las áreas más intrigantes y prometedoras es el metaaprendizaje. Pero, ¿qué es exactamente el metaaprendizaje y ...
Cargando...