Esta IA ha aprendido a conducir un coche en sólo 20 minutos: el próximo paso es que aprenda a circular

Un coche autónomo capaz de aprender a conducir por sí mismo. El equipo de Wayne, una empresa fundada por investigadores del Departamento de Ingeniería de la Universidad de Cambridge, dice haber desarrollado un algoritmo de "aprendizaje reforzado" con el que la inteligencia artificial de un coche ha sido capaz de aprender a conducirlo en sólo 15 o 20 minutos.

Se trata de un método para entrenar sistemas de IA que ya hemos visto aplicados de otras maneras, como cuando DeepMind lo utilizó para que AlphaGo aprendiese a jugar al juego de mesa "Go" a base de prueba y error. Ahora, los investigadores de Wayne dicen que estamos ante la primera demostración de aprendizaje reforzado aplicado en los coches.

Para conseguirlo ha hecho falta un coche especialmente preparado, así como un conductor humano que iba corrigiendo los errores que hacía el coche durante las sucesivas pruebas... hasta que dejó de hacerlos. Y tampoco es que en estos 20 minutos hayan conseguido crear a un Fernando Alonso, sino que más bien la IA ha aprendido a permanecer dentro de un carril, que es algo muy diferente a aprender a circular.

Como demostración, en Wayve han publicado este vídeo en el que muestran el proceso de aprendizaje. Dentro del coche va un piloto que corrige los errores que comete la IA en cada intento. Con estas correcciones, el algoritmo va aprendiendo poco a poco a mantener el coche recto, hasta que al cabo de once intentos ya es capaz de mantenerse dentro de un carril sin desviarlo.

En el vídeo también podemos ver cómo en las primeras dos o tres pruebas el algoritmo tendía a irse enseguida hacia los lados, pero que poco a poco iba ganando confianza y estabilidad. Al final del vídeo también nos enseñan cómo finalmente su coche autónomo aprende a conducir lo suficiente como para no sólo mantenerse en el carril, sino a hacerlo durante curvas y en intersecciones.

Uno de los aspectos más llamativos es que esto se ha conseguido, siempre según los investigadores, utilizando un único procesador, midiendo el ángulo de dirección y velocidad, y con un sistema que utiliza una única imagen monocular. El objetivo de esta empresa, tal y como le han dicho a medios como CNet, es el de conseguir "mejores cerebros" para sus vehículos, no más hardware.

Sólo son los primeros pasos

Evidentemente, una cosa es aprender a manejar un coche manteniéndolo dentro de un carril y otra muy diferente el poder hacerle circular en una vía pública. Sin embargo, nos encontramos ante la aplicación de un método de aprendizaje para algoritmos de inteligencia artificial que ya ha demostrado su éxito a largo plazo, por lo que se trata de un avance importante.

En primer lugar, se trata de un método de entrenamiento que no necesita programar nada a mano ni utilizar complejos sistemas de mapeado en 3D. Simplemente aprende de sus errores con un sistema de tres pasos. Primero una exploración en la que el sistema realiza acciones y guarda los datos, después una optimización utilizando esos datos, y a continuación un proceso de evaluación con el que ver cómo se ha comportado el modelo. Y a partir de ahí pues otra vez a empezar.

Su finalidad no es enseñar a un coche a conducir desde cero, sino ser capaces de aportar un método para perfeccionar los sistemas actuales de conducción autónoma. En su artículo con todos los detalles hablan de partir de un algoritmo que inicialmente tiene el 95% de la calidad humana a la hora de conducir, y ser capaces de hacer que conduzcan incluso mejor que los humanos en pocos meses.

Evidentemente, para que esto sea posible la tecnología todavía tiene mucho que mejorar. Esto es algo en lo que la empresa dice estar trabajando, y que quiere ampliar su tecnología para ser capaces de enseñarle a un coche a completar tareas de conducción más complejas, como entender los semáforos, las rotondas o las intersecciones.

Vía | Wayve
En Xataka | Este robot de DeepMind sólo ha recibido una tarea, ha aprendido por sí mismo a moverse y completarla