NVIDIA ha aprovechado la conferencia NeurIPS, considerada uno de los eventos de referencia en inteligencia artificial, para ampliar su catálogo de modelos, conjuntos de datos y herramientas abiertas, tanto en el ámbito de la IA física como en el de la IA digital, presentando desarrollos con potencial de uso en numerosos campos de investigación, aunque el que más llama la atención es el de la conducción autónoma.
NVIDIA DRIVE Alpamayo-R1 (AR1) es el modelo en cuestión, presentado como el primer modelo abierto de lenguaje y visión con razonamiento y capacidad de acción a escala industrial orientado a los vehículos autónomos.
Este sistema integra el razonamiento de tipo chain-of-thought con planificación de trayectorias, un componente clave para avanzar con seguridad en la conducción autónoma en escenarios complejos, y con ello permite habilitar un nivel SAE 4 de autonomía en la conducción.
Esto significa que el vehículo que lo integra dispone de una gran capacidad de movilidad autónoma, especialmente en vías no urbanas o en áreas geográficas concretas que disponen de balizas electrónicas de señalización para guiar el coche e informarle de las incidencias que pueda haber en la red.
No obstante, el vehículo todavía necesitará del concurso del conductor en el resto de las áreas, especialmente en las urbanas densamente pobladas, y también puede que sea incapaz de conducir por él mismo en condiciones climáticas adversas.
Por encima de este nivel solamente queda uno, el 5, que supone la automatización completa del vehículo, que podrá circular por cualquier lugar y en cualesquiera condiciones climáticas, incluso las adversas.
Ello implica que, en vehículos equipados con el presente modelo de lenguaje de NVIDIA, todavía encontraremos controles para un conductor humano, tales como el volante o los pedales, a diferencia de su ausencia en los de nivel 5, que pueden prescindir de ellos al ser totalmente automatizados.
Frente a generaciones anteriores de modelos de conducción, que tenían dificultades con situaciones como intersecciones muy concurridas, cierres de carriles o vehículos aparcados en doble fila, AR1 incorpora mecanismos de razonamiento que buscan aproximarse más al comportamiento humano al volante. El modelo descompone cada situación de tráfico en pasos, analiza distintas trayectorias posibles y combina dichos cálculos con información contextual para elegir el recorrido que considera más adecuado.
Por ejemplo, en un entorno con gran densidad de peatones junto a un carril bici, el sistema puede incorporar datos de la ruta, trazas de razonamiento que explican las decisiones tomadas y otros factores contextuales para ajustar su trayectoria. Entre las posibles acciones se incluyen separarse del carril bici o detenerse ante la posibilidad de que se crucen peatones fuera de los pasos habilitados, decisiones que se integran en la planificación de la futura ruta.
La base abierta de AR1 se apoya en NVIDIA Cosmos Reason y permite a la comunidad de investigadores adaptar el modelo a casos de uso no comerciales, tanto para tareas de evaluación comparativa, como para proyectos experimentales de conducción autónoma. En la fase posterior de entrenamiento, los responsables del modelo señalan que el uso de técnicas de refuerzo ha aportado una mejora significativa en su capacidad de razonamiento frente al modelo preentrenado.
NVIDIA ha publicado AR1 en GitHub y Hugging Face, junto con un subconjunto de los datos empleados para entrenar y evaluar el sistema, que se distribuyen dentro de los NVIDIA Physical AI Open Datasets. Además, se ha liberado el marco de evaluación AlpaSim como complemento para analizar el rendimiento del modelo.
Durante el evento NeurIPS, la organización Artificial Analysis ha destacado la estrategia de apertura de NVIDIA mediante su nuevo Openness Index, un indicador independiente que evalúa tecnologías de IA en función de la permisividad de las licencias, la transparencia sobre los datos y la disponibilidad de detalles técnicos. En este índice, la familia de tecnologías abiertas NVIDIA Nemotron para el desarrollo de IA avanzada se sitúa entre las más abiertas del ecosistema.