Waymo es probablemente la principal empresa de ‘robotaxis’ verdaderamente funcional, con servicios de transporte que ya operan en áreas limitadas a unas pocas áreas y ciudades de EE. UU.
La compañía, que nació como parte de una idea de Google para el desarrollo de un coche autónomo, acaba de anunciar un nuevo proyecto que utiliza la tecnología Gemini AI para dotar a sus vehículos de capacidad de decisión en cuanto a las trayectorias a seguir.
El proyecto se basa en un nuevo modelo de formación denominado Modelo Multimodal End-to-End para Conducción Autónoma (EMMA), creado a partir de los modelos LLM de Gemini, concretamente el modelo multimodal de lenguaje grande (MLLM) de Google.
Decisiones más inteligentes

Imagen: Waymo
El nuevo proyecto de Waymo fue presentado a través de un documento que detalla cómo la tecnología de Gemini podría mejorar el funcionamiento de los ‘robotaxis’.
Según información de The Verge, este documento comienza detallando cómo los sistemas de conducción autónoma han desarrollado componentes para funciones específicas, por ejemplo, percepción, mapeo, planificación y predicción.
Dado que la historia de estos componentes reveló algunos problemas en la comunicación entre ellos y, en consecuencia, en la adaptación a nuevos entornos, modelos de lenguaje como Gemini nos permiten añadir más ‘conocimiento’ y una capacidad de razonamiento superior.
Traducida a la realidad de los servicios de Waymo, la idea es que sus vehículos autónomos ya no limitarán su acción a áreas y ciudades específicas y bien definidas, sino que podrán operar en áreas adicionales, utilizando algoritmos para generar decisiones ‘inteligentes’ sobre trayectorias y formas de evitar obstáculos.
Con esta nueva solución basada en la tecnología Google Gemini, Waymo pretende dar el siguiente paso en la mejora de sus vehículos autónomos, añadiéndoles la capacidad de ‘pensar’ como un conductor, reproduciendo el razonamiento humano.