Sony AI ha creado otro agente de carreras autónomo, esta vez utilizando Gran Turismo 7 para evaluar lo que llama el "primer agente de carreras de coches superhumano" con entradas locales. En otras palabras, puede "ver" los píxeles que lo rodean y actuar en consecuencia.

La IA es una palabra de moda en la actualidad, con herramientas como Gemini de Google que buscan respuestas en Internet o generadores de voz que imitan a los de Morgan Freeman. Si buscas una imagen un poco extraña de un payaso montado en un monociclo en el año 2056, probablemente exista una herramienta impulsada por IA que te ayude con esa tarea.
Pero todo eso parece bastante reductivo, como poner a la experta en la Antigua Roma, la profesora Mary Beard, en un episodio de Selling Sunset.
La inteligencia artificial podría usarse para mucho más que formular discursos de boda banales; quizá aún no hayamos visto lo mejor de ella.
En nuestra burbuja de los videojuegos de carreras y los deportes de motor, los jugadores están familiarizados desde hace mucho con la "IA"; para nosotros, el concepto básico no es nada nuevo. Llevamos décadas compitiendo "contra la computadora", ya que el juego y el hardware que lo ejecuta hacen que los rivales conduzcan por la misma pista que tú.

Sin duda, algunos lo hacen mejor que otros. Una crítica relativamente sencilla de un juego o simulación es que "la IA es mala", que carece de atención, que se amontona en la primera vuelta o que se estrella repetidamente en el mismo punto.
Esto se debe a que, en un nivel básico, nunca aprenden realmente. No pueden comprender cuándo cometen un error y les cuesta cambiar su comportamiento en función de lo que sucede a su alrededor.
Cuando Gran Turismo Sophy se lanzó al público en Gran Turismo 7 a finales de 2023, el agente potenciado por inteligencia artificial fue una revelación. Tus oponentes podían atacar, defenderse y evitar posibles incidentes de una forma más natural.
Una diferenciación clave entre la "IA" preprogramada a la que muchos están acostumbrados y un agente como GT Sophy es su capacidad para adaptarse al contexto.
Ha sido la culminación de casi cinco años de trabajo, hasta ahora, con la actualización de Gran Turismo 7 de julio de 2024 que amplía la lista de pistas en las que puede competir.
Un nuevo agente de carreras de IA de Sony que tiene ojos
Pero para el equipo global de Sony AI, eso no fue suficiente. Han estado trabajando diligentemente en un agente de IA exploratorio, en paralelo a GT Sophy.
Una vez más, utilizando Gran Turismo como banco de pruebas, y todavía en una etapa de prototipo, la forma en que recibe e interpreta la información es diferente: puede "ver".
“Cuando tú o yo jugamos, por supuesto, miramos la interfaz de usuario y analizamos esa información de una manera que nos parezca razonable y usamos esa información para manejar el juego”, explica Kaushik Subramanian, científico investigador sénior de Sony AI.

Trabaja junto a Takuma Seno, un colega investigador científico y uno de los autores principales de un artículo de investigación publicado recientemente que cubre los últimos avances.
“Sin embargo, cuando entrenamos a GT Sophy, le proporcionamos información muy precisa sobre dónde se encuentra en la pista: la forma de la pista, su velocidad exacta, su aceleración y dónde están otros coches.
“Entonces, hay una diferencia en términos de lo que absorbe Sophy y lo que absorben los jugadores humanos.
“Lo que queríamos explorar es si podíamos entrenar un agente que trabajara con entradas de imágenes”.
“Si tomara una imagen de cómo se ve el juego (un auto circulando por una pista con líneas, barreras, árboles y nubes) e intentara entrenar al agente de carreras con eso como entrada, ¿sería posible?”

Eso es exactamente lo que utiliza el agente exploratorio. Imagine una cámara dentro de un automóvil o un par de ojos (una vista de cámara egocéntrica en la jerga de la IA de Sony). La nueva IA "mira" desde el exterior del vehículo e interpreta lo que puede "ver", experimentando la velocidad en combinación con datos en forma de velocidad exacta.
En consecuencia, el objetivo es que coincida con lo que los humanos tienen a su disposición cuando juegan, y que la imagen ayude a explicar la forma de la pista. A diferencia de GT Sophy, no se le proporciona información como la forma precisa de la pista, el ángulo de deslizamiento de los neumáticos (y la relación de deslizamiento) o la carga de las ruedas.

“Una de nuestras motivaciones internas fue intentar ver cuánto podemos relajar algunas de las entradas de datos que llegan al agente”, continúa el graduado de doctorado del Instituto de Tecnología de Georgia, que ha estado en Sony AI desde 2019 y trabajó en proyectos relacionados con Gran Turismo desde el principio.
"Lo fascinante de esto es que no tenemos que controlar en qué se centra. Nosotros proporcionamos la imagen y el enfoque de IA aprende en qué debe centrarse para obtener el resultado que nos interesa".
“Le decimos a la IA que su objetivo es conducir lo más rápido posible, mantenerse en el camino y evitar chocar con las barreras.
“Con un tiempo de entrenamiento, el algoritmo aprende a centrarse en las partes relevantes de la imagen para cumplir ese objetivo. En una sección recta, la IA se centra en lo que se acerca a la distancia.
“Mientras tanto, si está mirando una curva, los puntos de marcado rosados [usados para determinar su enfoque] podrían alinearse en los bordes de la pista para ayudarlo a mantenerse dentro de los límites del recorrido”.
Un agente de aprendizaje pionero en el mundo para simular carreras de coches
Por ahora, el nuevo modelo sólo funciona en situaciones de contrarreloj, aunque “parece un siguiente paso razonable aprovechar este trabajo y mejorar otras situaciones, incluidas las carreras con coches rivales”, teoriza Subramanian.
Una IA que recorre una pista rápidamente es una hazaña, pero ayudarla a comprender la etiqueta de las carreras es otra muy distinta.
Tal como están las cosas, se trata de un solo coche, una sola pista y, en este caso, ha aprendido a ser significativamente más rápido que la mayoría de los jugadores humanos. Puede tomar la línea óptima, con una precisión milimétrica, en todo momento.

Esto sigue a un ejercicio que dura entre 10 y 14 días en un grupo de PlayStations con acceso a Gran Turismo 7; no se garantiza de ninguna manera que este nuevo modelo llegue a las versiones minoristas y todavía se encuentra en una fase exploratoria.
Durante este tiempo, la IA utiliza el aprendizaje por refuerzo para ponerse al día. En esencia, se trata de una forma de ensayo y error, que comienza de forma aleatoria pero que, con el tiempo, acaba por convertirse en una técnica maestra.
“Al final, el resultado es lo que llamamos una política, una política que actúa como un controlador”, explica Subramanian, quien reside en Alemania y es coautor de dos artículos de investigación sobre carreras y uno sobre conducción autónoma.
“Después de dos semanas de entrenamiento, el controlador está listo y ha aprendido a hacer la mejor vuelta. Pulso el botón de inicio y me da ese tiempo de vuelta en el primer intento”.
El resultado neto, hasta ahora, es un agente que puede ofrecer tiempos aproximadamente similares a los del GT Sophy existente, pero sin la necesidad de instrumentación externa. Se trata de la creación del primer agente de carreras de autos simulado superhumano con entrada de sensores locales.
Sin embargo, no se puede evitar la sensación de que el equipo de IA de Sony quisiera ampliar los límites aún más.

"Por nuestra parte, tenemos varios objetivos, incluidas varias cuestiones de investigación internas, que estamos intentando superar hasta el límite", explica el experimentado experto en aprendizaje de refuerzo.
“Ampliar la visión a otras situaciones es sin duda algo que nos interesa. Intentaremos hacer todo lo que podamos en ese ámbito.
“Por supuesto, también hay GT Sophy implementado en el juego y esa es una idea emocionante en nuestra mente para asegurarnos de que los jugadores estén contentos con la versión que está en el juego.
“Cuando comenzamos el proyecto, no estábamos muy seguros de si realmente se podía aprender, porque sabemos que los humanos lo hacen, pero la pregunta era: ¿puede la IA hacerlo también? Nos llevó un tiempo, varios años, llegar a donde estamos ahora, y los resultados hasta ahora han sido muy prometedores”.
El último agente de carreras autónomo de Sony AI, de un vistazo
- El equipo de IA de Sony utilizó PlayStations y Gran Turismo 7 para evaluar al agente exploratorio, pero no está confirmado para un lanzamiento público.
- Un agente de IA diferente a Gran Turismo Sophy, actualmente en fase de investigación
- El primer agente de carreras de autos simulado con súper-visión y superhumano
- Puede superar a los mejores pilotos de Gran Turismo del planeta en una sola vuelta.
- A diferencia de GT Sophy, que depende de instrumentación externa como información precisa sobre la forma de la pista, el ángulo de deslizamiento, la relación de deslizamiento y la carga de las ruedas (entre otros), el nuevo agente puede "ver" píxeles (la "imagen") a través de una "vista de cámara egocéntrica" además de recibir información sobre velocidad y aceleración.
https://traxion.gg/how-sony-ai-created-a-new-super-human-racing-agent-that-can-see-using-gran-turismo-7/