Desarrollar la tecnología necesaria para lograr que un vehículo autónomo funcione de forma adecuada es una tarea compleja. Tanto, que el gran líder de la industria (Waymo, una compañía subsidiaria de Google) ha decidido compartir con su competencia los datos que han ido recopilando sus vehículos.
¿La razón? Su convencimiento de que "cuantos más grandes cerebros podamos juntar para resolver los problemas, aunque no procedan de nuestra compañía, mejor". Así resume Drago Anguelov, científico principal de Waymo, la decisión de compartir esa valiosa información para lograr resolver los problemas con los que se ha enfrentado su compañía, y acelerar así el desarrollo de esta tecnología.
Sin embargo, pese a que hasta hace muy poco las compañías guardaban con sumo celo estos datos, la reticencia para compartirlos empieza a ser algo del pasado: incluso antes de que Waymo diera este paso, otros rivales como APTIV o Lyft ya habían tomado la iniciativa de publicar los datos recopilados por sus vehículos.
Otra compañía, Argo AI, anunció la inminente publicación de su dataset en la misma conferencia en que lo hizo Waymo; en su caso incluye únicamente 113 escenas grabadas en dos ciudades, pero también es la única que ha incluido datos de sus mapas de alta definición.
Lo relevante es que, en todos estos casos, la motivación alegada por la compañías es la misma: el convencimiento de que todos saldrán ganando. Eso sí: según el responsable de producto de Waymo, Vijaysai Patnaik,
"El hecho de que tanto Waymo como otras compañías estén liberando sus datos no va tanto de decir 'Eh, este problema es muy complicado, creo que deberíamos poner en común nuestros datos' como de afrontar que debemos dar un empujón a la comunidad de investigadores**, para quienes resulta muy difícil acceder a fuentes de datos de esta clase
La importancia de los datos (y de compartir)
Pero ¿qué tienen de especial esos datos? ¿por era tan importante tanto protegerlos antes como compartirlos ahora? Veamos: en un día normal, un coche autónomo de pruebas puede recopilar una enorme cantidad de datos en bruto (más de 4 Tb, según explica en Forbes Sam Abuelsamid, analista de Navigant Research).
Pero no todos esos terabytes resultan útiles: un ingeniero, que acompaña al director de seguridad en los trayectos, va anotando las situaciones más relevantes en que se ve implicado el vehículo (normalmente encuentros con señales de tráfico, ciclistas, peatones y animales).
Y son estas situaciones las que se terminan analizando y etiquetando a mano... esta última, una tarea para la que pueden hacer falta cientos o miles de humanos que analicen cuidadosamente las escenas para comprender todos los elementos relevantes de las mismas.
Una vez que todo ese trabajo ha sido realizado, es cuando los investigadores tienen la oportunidad de desarrollar algoritmos capaces de mejorar la predicción del comportamiento del resto de usuarios de las calles y carreteras. Según Anguelov:
"[En Waymo] sentimos (no sólo nosotros, bastantes más compañías también ha llegado a la misma conclusión) que actualmente el campo se está viendo obstaculizado por la ausencia de los datos adecuados. Decidimos ayudar a que los investigadores académicos se hicieran las preguntas correctas y, para ello, necesitan trabajar con los datos correctos".
El objetivo último claro, es obtener el Santo Grial de la conducción autónoma: el nivel 5 de la norma SAE J3016, es decir, el máximo nivel de automatización posible. Hasta ahora, la industria sólo ha sido capaz de ofrecer coches autónomos de nivel 2 (sí, incluso el famoso 'Auto Pilot' de Tesla está así de limitado) por lo que dará la bienvenida a cualquier avance hacia el siguiente peldaño que sea capaz de ofrecer a unos consumidores deseosos de avances en este campo.
En el caso del dataset de vídeos publicados por Waymo (disponible en su web) se trata, en palabras de la compañía, en "uno de las mayores, más ricos y más diversos datasets sobre conducción autónoma que jamás se han hecho públicos con fines de investigación".
Las imágenes (1000 escenas de conducción, cada una de 20 segundos, capturadas en 25 ciudades de los Estados Unidos), procedentes de las cámaras de alta resolución del los coches, vienen acompañadas también de datos captados con sensores LiDAR (siendo Waymo la primera compañía que ha publicado esta información).
Sumando todo esto, Waymo afirma que ese millar de escenas cubre "una amplia variedad de entornos, desde centros urbanos densos a paisajes suburbanos, así como datos recogidos durante el día y la noche, durante el amanecer y el crepúsculo, bajo el sol y bajo la lluvia".
Anguelov afirma que la intención de Waymo es ir publicando aún más datos: "Esto es sólo el primer corte", a la espera de recibir el feedback de la comunidad.
Imagen | Pixabay
Ver 5 comentarios