No hay una disciplina científica con más "eurekas" que la ciencia de materiales. Como no entendemos bien los intríngulis de la materia, el descubrimiento de materiales que tienen un conjunto particular de propiedades siempre ha sido un proceso tremendamente fortuito que requiere cantidades ingentes de buena ciencia, suerte y paciencia.
La historia de la tecnología está llena de ideas revolucionarias que se quedan durante décadas metidas en un cajón esperando a que seamos capaces de encontrar el material concreto que permita hacerlas realidad. Por eso, desde hace años, los científicos intentan utilizar la inteligencia artificial para tratar de agilizar estos procesos.
Ahora, un equipo de investigadores del Lawrence Berkeley National Laboratory han demostrado que gracias a una combinación de aprendizaje automático no supervisado y 'minería de textos' se pueden procesar millones de artículos científicos y encontrar relaciones que, hasta hoy, permanecían "ocultas". Hoy es en la ciencia de los materiales, pero no se va a quedar ahí.
IAs para descubrir materiales

Solo necesitamos imaginar las innumerables combinaciones de componentes y estructuras posibles, para darnos cuenta de que el desarrollo de materiales es una tarea que no se acaba nunca. Sobre todo porque los métodos tradicionales para el análisis de la composición de los materiales consumen mucho tiempo, son tremendamente aburridos y extremadamente caros. Según algunos expertos, se requiere un promedio de 10 años para que un laboratorio desarrolle un nuevo material y 20 años para que ese material pueda producirse en masa.
De ahí que el aprendizaje automático se haya convertido en una gran esperanza dentro del campo. Hasta ahora, la mayoría de enfoques se han basado en sistemas que nos permitieran asignar determinados parámetros estructurales (como las características de la composición del material) y determinadas propiedades físicas o electrónicas. La idea es utilizar esos sistemas para predecir las propiedades finales a partir de las iniciales, algo que no podemos hacer aún y que nos ahorraría mucho trabajo. Vamos haciendo avances, pero son enfoques aún muy verdes.
Minería de artículos científicos

Tshitoyan y su equipo han optado por otro enfoque. Según publican en Nature, han conseguido extraer conocimientos que hasta ahora se encontraban dispersos (y ocultos) en millones de artículos científicos de manera efectiva gracias a un algoritmo de aprendizaje automático.
Para ello, el equipo recopiló 3,3 millones de resúmenes de artículos sobre ciencias de los materiales publicados entre 1922 y 2018. Estos resúmenes se procesaron (para descartar textos que no estuvieran en inglés, etc... hasta dejarlos en un millón y medio) y se analizaron con un algoritmo de aprendizaje automático no supervisado (Word2vec). Ese algoritmo utiliza redes neuronales para realizar estimaciones sobre el significado de las palabras y sus patrones de uso en el texto original.
Ahí estaba la clave. Al analizar el banco de textos, los científicos descubrieron que el algoritmo era capaz de identificar posibles materiales relacionados con distintas propiedades físicas y eléctricas. Por ejemplo, entrenaron al sistema para predecir la probabilidad de que el nombre de un material en concreto coexistiera con el término "termoeléctrico". Fue un éxito, pero hay que reconocer que eso era sencillo.

Lo interesante vino después, cuando buscaron materiales que, aunque no se habían relacionado directamente con la termoelectricidad, sí tenían una fuerte relación semántica según los análisis previos del algoritmo. En este caso, para evaluar su efectividad, los investigadores cogieron un año al azar y pidieron al sistema que seleccionara los materiales con posibles propiedades termoeléctricas con la evidencia disponible. Y, sorprendentemente, también funcionó: los materiales seleccionados tenían ocho veces más probabilidad de haber sido estudiados, con éxito, en los siguientes cinco años.
El equipo investigó otros conceptos como ‘fotovoltaico’ o ‘ferroeléctrico’ con resultados muy parecidos. Resultados que rápidamente han disparado la imaginación de la gente con sus posibles aplicaciones en los más distintos campos del saber. Cada año se publican más de dos millones de artículos científicos, ¿Qué misterios habrá ocultos en esa enorme cantidad de trabajo? Me temo que la respuesta a esa pregunta la tendremos antes de lo que podríamos esperar.
Ver 32 comentarios
32 comentarios
imf017
"Estos resúmenes se procesaron (para descartar textos que no estuvieran en inglés, etc... hasta dejarlos en un millón y medio)"
Y ahí es donde seguramente estemos perdiendo un montón de información importante sólo por estar escrita en otro idioma. Muy mal por parte de los desarrolladores y fatal por parte de la humanidad. Deberíamos tener un único idioma.
Usuario desactivado
"Me temo que la respuesta a esa pregunta la tendremos antes de lo que podríamos esperar... "
No entiendo por qué has construido así la frase. "Me temo" en todo caso se utiliza cuando el contexto al que vas a referirte es negativo en lo que concierne a todo lo que has hablado antes. Vamos, que la frase construida así, da a entender que no recibes de buen agrado el que "la respuesta a esa pregunta" llegue más pronto que tarde.
sanamarcar
Sin duda, pero luego hay mogollón de base de datos, en el idioma generalmente cualquiera, pero vamos si no es ingles tampoco se considera muy serio, y luego la presentación de la información no está muy estandarizada. Pero bueno supongo que poco a poco.
dayb
El artículo en sí muy bien. Es muy divulgativo y completo y por eso lo aplaudo, pero... ¡ESE TITULAR! (vayamos por partes)
1. "Una IA". La IA (inteligencia artificial) es una rama de la computación, una parte de la ciencia. No es un objeto sino una categoría. De la misma forma que "una física" no se dice, pues no tiene sentido decir "una IA". Lo correcto es hablar de sistemas inteligentes.
2. "Se lee...". De nuevo tratamos con la personificación y antropomorfización de los sistemas inteligentes, como si hubiese sido una decisión tomada independientemente por la máquina (cosa que no es así).
3. El Word2Vec no es un algoritmo. Es más bien una función matemática (básicamente, una multiplicación matricial). Sí es un algoritmo el método que se usa para calcular los valores de esa matriz. Recordemos que un algoritmo no es más que una receta, una serie de instrucciones con condiciones, repeticiones y demás. Los sistemas de IA basados en redes neuronales son (todavía) equivalentes a funciones matemáticas más o menos estáticas.
Por todo lo demás, ¡Genial! Me alegro de que estas técnicas vayan llegando poco a poco al público. Tienen un potencial enorme, que a penas se ha empezado a ver. El Word2Vec es una técnica que ya tiene sus 4-5 años y ahora mismo hay formas de incluso explotar documentos en varios idiomas (Facebook tiene resultados muy interesantes al respecto).
rober7064
La profesión de sintetista que aparece en "Todos sobre Zanzíbar" se empieza a hacer realidad en versión IA.
hasso78
Guste o no, el idioma de la ciencia e informática es el inglés.. además de qué en todo el mundo se oye música en inglés y lo que se ve en el cine es cultura exportada desde Hollywood.
pablomartin2
Qué raro que no diga nada sobre el grafeno ...