ChatGpt Demuestra Que Puede Pilotar Una Nave Espacial

ChatGpt es sorprendentemente bueno pilotando naves espaciales
Imagen: ChatGpt

 El modelo de lenguaje grande (LLM) ChatGPT de OpenAI es sorprendentemente bueno pilotando naves espaciales, según un equipo que lo entrenó para participar en una competencia de simulación de vuelos espaciales, donde obtuvo el segundo lugar.

En 2015, el estudio mexicano de videojuegos Squad creó el exitoso videojuego Kerbal Space Program. En este juego de simulación de vuelos espaciales, juegas con un grupo de extraterrestres al mando del equivalente extraterrestre de la NASA. Debes diseñar y construir tu nave espacial antes de intentar escapar de la atmósfera del planeta Kerbin y dirigirte a otros cuerpos celestes.

El juego presenta física orbital pseudorrealista que, si bien no es perfecta, permite a los jugadores realizar maniobras muy interesantes, como las órbitas de transferencia de Hohmann, que se utilizan para transferir una nave espacial entre dos órbitas diferentes.

"Aunque una nave espacial podría seguir diversas trayectorias curvas desde la Tierra hasta Marte, una trayectoria llamada órbita de transferencia de Hohmann es la que consume menos energía y, por lo tanto, se considera la más eficiente", explica la NASA sobre la maniobra.

"La transferencia de Hohmann es una órbita elíptica con el Sol en uno de los focos de la elipse que interseca la órbita del planeta objetivo. El lanzamiento ocurre cuando la Tierra se encuentra en el perihelio de Hohmann (el punto de la órbita de Hohmann más cercano al Sol). La llegada ocurre cuando Marte se encuentra en el afelio de Hohmann (el punto de la órbita de Hohmann más alejado del Sol). Dependiendo de los objetivos de la misión y las características de la nave espacial, los ingenieros utilizarán variaciones en la órbita de transferencia de Hohmann para llevar la nave espacial a Marte. Estas variaciones pueden hacer que el tiempo de viaje sea más o menos largo que una transferencia de Hohmann estándar."

La física, si bien es lo suficientemente buena como para que algunos propongan usarla para enseñar matemáticas y física, puede hacerse más realista con modificaciones adicionales.

Aunque KSP no ofrece una simulación perfecta de la realidad, ha sido elogiado por su precisa mecánica orbital, llegando incluso a establecer una colaboración con la NASA que elevó su estatus más allá de un simple juego, explica el equipo en su artículo.

El entorno de simulación se limita a un problema de dos cuerpos y a un pequeño número de planetas, generalmente un planeta con forma de Tierra llamado Kerbin.

Recientemente, investigadores han creado el desafío Kerbal Space Program Differential Games (KSPDG), en el que los equipos compiten utilizando agentes autónomos de inteligencia artificial (IA) para controlar su programa espacial.

Los participantes desarrollarán agentes autónomos para maniobrar satélites que participan en operaciones espaciales no cooperativas (persecución de un satélite evasivo, operaciones de proximidad multisatélite, etc.) —explicaron los organizadores antes de la competición de 2025—. Se anima a los participantes a utilizar diversas tecnologías (aprendizaje por refuerzo, control óptimo, técnicas de teoría de juegos, etc.) para desarrollar algoritmos de control autónomo de naves espaciales.

El equipo optó por entrenar a LLM para la tarea y observar su rendimiento.

Históricamente, los sistemas de Guiado, Navegación y Control (GNC) de naves espaciales se han basado en métodos de control clásicos como el control Proporcional-Integral-Derivativo (PID), los Reguladores Cuadráticos Lineales (LQR) y técnicas más avanzadas como el Control Predictivo de Modelos (MPC) y el control robusto, explica el equipo.

Si bien estos métodos han garantizado operaciones fiables de naves espaciales, a menudo requieren un ajuste exhaustivo y un modelado dinámico preciso. La IA y el aprendizaje automático, en particular el Aprendizaje por Refuerzo (RL), han surgido como alternativas prometedoras, ofreciendo soluciones más adaptativas que optimizan las políticas de control mediante la interacción con el entorno, con ejemplos notables que incluyen agentes entrenados para tareas como la asignación de sensores y el aterrizaje planetario.

El equipo descubrió que el entorno KSPDG no era adecuado para el aprendizaje por refuerzo. En su lugar, desarrollaron un sistema para traducir los datos de telemetría del juego a un lenguaje que los LLM pueden descifrar y utilizar para tomar decisiones. El LLM luego transmite su decisión en formato de texto, que se devuelve a KSPDG para controlar las acciones de los Kerbals. Sin embargo, dadas las cuestionables habilidades matemáticas de la IA, el equipo tuvo que esforzarse un poco más para obtener los resultados.

"La ingeniería de indicaciones básica no aborda las limitaciones aritméticas de los LLM al manejar grandes cantidades", explican. "Al realizar el aumento de indicaciones, mejoramos el espacio de observación calculando el vector progrado para ayudar al modelo a cumplir su misión".

Si bien el equipo obtuvo el segundo puesto en la competencia, perdiendo frente a un equipo que adoptó un enfoque de ecuaciones diferenciales, quedaron bastante satisfechos con los resultados y creen que podrían mejorarse aún más mediante técnicas de aprendizaje por refuerzo.

«En trabajos futuros, si bien nuestros resultados indican que el RL no es una alternativa adecuada en este escenario específico, nuestro objetivo es explorar los posibles beneficios de integrar ambos enfoques para mejorar el rendimiento general», concluyen. «Sin embargo, es importante señalar que el entorno de simulación utilizado en este estudio está diseñado para el cálculo en tiempo de prueba y no es propicio para métodos de aprendizaje basados ​​en políticas».


El estudio se publica en Advances in Space Research.

0/Post a Comment/Comments

Artículo Anterior Artículo Siguiente