El periodista y escritor estadounidense Richard L. Brandt asegura en ‘Las dos caras de Google’, el ensayo que dedicó en 2009 a los fundadores de esta compañía, que solo alguien con la determinación de Larry Page y Serguéi Brin podía colocar a Google en la posición que tiene hoy en día. Y, además, en un tiempo récord. Muchos de nosotros utilizamos algunos de sus servicios cada día, lo que ha provocado que parezca que lleva toda la vida entre nosotros. Pero no es así. En realidad, apenas ha superado la adolescencia.
En su libro Brandt cuenta una anécdota interesante que puede ayudarnos a entender la resolución con la que Page y Brin defienden sus ideas. En enero de 1999 la sede de Google era un pequeño apartamento de Menlo Park, una localidad del norte de California situada a caballo entre San Francisco y San José, en el que solo trabajaban siete personas, incluidos los dos fundadores. Pero las aspiraciones de Brin y Page ya eran inusualmente atrevidas: querían que su empresa llegase a ser tan importante como lo era Yahoo! en ese momento.
Mucho antes de que Google tuviese la envergadura actual Larry Page y Serguéi Brin estaban convencidos de que su compañía sería tan importante como lo fue Yahoo! en su momento
Karsten Lemm, un reportero de la revista alemana Stern, llamó aquella mañana a la puerta de aquel apartamento con el propósito de entrevistar a dos emprendedores más de los muchos que entonces proliferaban como setas en el área de Silicon Valley. Al fin y al cabo, aquella pequeña empresa tan solo tenía un buscador para Internet, uno nuevo que difícilmente podría competir con gigantes como AltaVista o Yahoo!, que eran dos de los motores de búsqueda más exitosos a finales de la década de los 90.
Pero Lemm se equivocaba, y probablemente cualquiera de nosotros hubiese pensado lo mismo en su lugar. Estas palabras pronunciadas por Serguéi Brin aquella mañana después de explicar al reportero por qué creían que su buscador no llegaba tarde reflejan con claridad la convicción que ya entonces tenían los fundadores de Google: «Hay algo más importante todavía, y es ofrecer al mundo lo que hemos hecho. Esto es apasionante, por supuesto. Y creemos que tiene potencial para cambiar las cosas de verdad y para siempre».
Así era Internet antes de Google
Cuando el motor de búsqueda de Page y Brin vio la luz en 1997 más allá de los muros de la Universidad de Stanford los usuarios que frecuentábamos Internet teníamos decenas de buscadores a nuestra disposición. JumpStation, WebCrawler, Lycos, Daum, Excite, Yahoo! o AltaVista son solo unos pocos, pero había muchos más. De hecho, en cierta medida Google inevitablemente bebió de muchos de estos motores, a pesar de que, como veremos más adelante, tenía características diferenciales que le permitieron desmarcarse de todos ellos y superarlos.
Los motores de búsqueda son una consecuencia directa e ineludible de la concepción de la World Wide Web tal y como Tim Berners-Lee la implementó en 1989. Internet existía antes de Berners-Lee, pero fue este investigador durante la época en la que trabajó en el CERN (Organización Europea para la Investigación Nuclear) el que se dio cuenta de que los enlaces entre los documentos podían resultar útiles para distribuir y compartir la información de una manera mucho más eficiente.
Él y sus colaboradores no solo implementaron el lenguaje HTML, que utiliza etiquetas para crear enlaces entre los documentos, sino también el protocolo HTTP, que facilita el acceso a los documentos, y las direcciones URL, que permiten ubicar cada uno de esos documentos en Internet. Había nacido la Red tal y como la conocemos hoy en día, pero aún había un problema importante que era necesario resolver: necesitábamos una herramienta que nos ayudase a localizar la información que estábamos buscando en ese océano creciente de documentos vinculados mediante enlaces de hipertexto.
La primera respuesta a esa necesidad realmente bien documentada fue Archie, que vio la luz a finales de 1990. La mayor parte de las fuentes recoge que este fue el primer motor de búsqueda que nos permitía bucear en una parte de la World Wide Web con el objetivo de localizar un documento determinado. Aun así, hasta 1993 el contenido de la Web se indexaba a mano y era supervisado por el propio Tim Berners-Lee, que alojó una lista con el repositorio de servidores web que tenían localizados en uno de los servidores del CERN.
Poco después de Archie (que se construye a partir del vocablo en inglés ‘archive’ eliminando la ‘v’) llegaron Veronica y Jughead, en 1991. Veronica, un acrónimo que procede de la designación anglosajona ‘Very Easy Rodent-Oriented Net-wide Index to Computerized Archives’, era un motor de búsqueda diseñado para localizar los nombres de los ficheros y los títulos de los documentos registrados en Gopher, un protocolo TCP/IP utilizado para distribuir y recuperar documentos de Internet que pretendía alzarse como una alternativa a la World Wide Web propuesta por Berners-Lee.
Jughead, otro acrónimo que en esta ocasión procede de ‘Jonzy’s Universal Gopher Hierarchy Excavation And Display’, también trabajaba sobre Gopher, pero había sido ideado para recuperar información que permitiese elaborar menús a partir de servidores específicos de este protocolo. El problema es que hasta 1993 no había ningún motor de búsqueda capaz de indexar contenidos de forma automática. Archie trabajaba sobre catálogos de documentos indexados a mano, y Veronica y Jughead hacían algo similar, pero sobre Gopher. Afortunadamente, durante la segunda mitad de ese año el panorama cambió radicalmente.
En junio de 1993 Matthew Gray, un investigador del MIT (Instituto Tecnológico de Massachusetts), escribió en lenguaje Perl el código de Wanderer, el primer robot, o, simplemente, bot, capaz de indexar de forma automática los contenidos de la World Wide Web. Y durante el verano de ese mismo «milagroso» año Oscar Marius Nierstrasz, un profesor de informática de la Universidad de Berna, escribió, también en Perl, un conjunto de scripts diseñado para copiar periódicamente los índices de la Web que hasta ese momento se mantenían a mano y almacenarlos en un formato normalizado. La automatización de la World Wide Web acababa de empezar.
Nierstrasz desarrolló más sus algoritmos y en septiembre de 1993 escribió el código de W3Catalog, que es el motor de búsqueda en el que de alguna manera se inspiran todos los demás. La veda quedaba levantada para siempre. Pocos meses después, en diciembre, llegó JumpStation, que también utilizaba un robot web para indexar los contenidos de la Web. Y a continuación, en 1994, surgió WebCrawler, uno de los primeros motores de búsqueda en modo texto diseñados para ofrecer a los usuarios la posibilidad de localizar una página web a partir de una palabra o un conjunto de ellas.
La flexibilidad de WebCrawler lo hizo muy popular en poco tiempo, pero enseguida se vio superado por Lycos, un nuevo motor de búsqueda que vio la luz poco después y al que podemos considerar el primero que consiguió ser realmente popular. A continuación, en 1995, llegó Yahoo!, y no tardó en consolidarse como uno de los motores de búsqueda más exitosos del mundo, si no el que más, hasta que unos años más tarde surgió Google. Pero entre uno y otro aún llegaron al mercado muchos otros buscadores. AltaVista, Dogpile, HotBot, Ask o Yandex son solo algunos de ellos.
Muchos de los motores de búsqueda que vieron la luz antes de la llegada de Google siguen existiendo hoy en día, aunque es evidente que su presencia se ha visto eclipsada por el buscador ideado por Serguéi Brin y Larry Page. Aun así, es interesante comprobar que en menos de tres décadas hemos pasado de una aproximación a Internet en la que era necesario «apuntar a mano» qué contenidos estaban disponibles y dónde residían, a un modelo completamente automatizado en el que los usuarios no tenemos que preocuparnos en absoluto por la dirección en la que se encuentra aquello que estamos buscando.
Pero esta comodidad tiene un precio. Y es que la mayor parte de nosotros únicamente tiene la visión de Internet que nos proporciona el motor de búsqueda que utilizamos. Sea Google o cualquier otro. E Internet es mucho más que eso. Llegados a este punto procedería que hablásemos de esa red profunda, oculta e ingente a la que los anglosajones llaman Deep Web, pero nos adentraríamos en unos derroteros que escapan al propósito de este artículo. Aun así, si estáis interesados en averiguar algo más acerca de ella os sugiero que echéis un vistazo al artículo que estoy enlazando aquí mismo.
PageRank, el arma no tan secreta de Google, y algo más
Limitar el éxito que ha tenido una compañía con la envergadura de Google a un único algoritmo es una simplificación excesiva. Aun así, no cabe duda de que la sofisticación de PageRank, el algoritmo que aún hoy parece tener más peso en su motor de búsqueda, es en cierta medida responsable de la cuota de mercado que ha alcanzando este buscador.
Google no es el motor de búsqueda preferido por los rusos. Lo es Yandex. Ni por los chinos. La mayor parte de ellos elige Baidu. Los japoneses y los taiwaneses prefieren Yahoo! Y los surcoreanos, Naver. Tampoco es la elección de todos los europeos. Los ciudadanos de República Checa han adoptado mayoritariamente Seznam. Sin embargo, aquí acaban las excepciones. En el resto del planeta, casi de forma unánime, Google arrasa. ¿Por qué? Porque, objetivamente, funciona. Lo hace rápido, y, normalmente, lo hace bien. Y buena parte del mérito lo tiene PageRank, el algoritmo del que os he hablado en el párrafo anterior.
Antes de que indaguemos un poco en su interior nos viene bien repasar brevemente el currículo académico de Larry Page y Serguéi Brin. El primero se graduó en Ingeniería en Informática por la Universidad de Michigan, y después hizo el doctorado en informática en la Universidad de Stanford. Brin, que es de origen ruso y emigró a Estados Unidos de niño junto a sus padres cuando aún existía la Unión Soviética, se graduó en informática y matemáticas por la Universidad de Maryland, y posteriormente también cursó estudios de doctorado en informática en Stanford. Fue precisamente en esta última universidad en la que se conocieron.
Es evidente que el bagaje en informática de los dos era muy sólido. Además, Brin tenía una habilidad innata para las matemáticas, una cualidad en la que posiblemente influyeron sus padres, Michael y Eugenia, que eran matemáticos. Poco después de comenzar su doctorado en Stanford, Page asistió a una conferencia que le dio la idea de explorar las propiedades matemáticas de la World Wide Web asemejando su estructura de hiperenlaces a un enorme grafo, que es una estructura que se utiliza con frecuencia en matemáticas e informática para representar relaciones binarias entre los elementos de un conjunto.
Larry Page se dio cuenta de que, en realidad, los hiperenlaces eran a los documentos de Internet esencialmente lo mismo que las citas en las publicaciones científicas: una forma de medir la relevancia. Así que decidió escribir un rastreador web, al que llamó BackRub, que le permitiese explorar e indexar las páginas web de aquella estructura que parecía dar soporte a la World Wide Web. Su amigo Serguéi Brin no tardó en unirse a su plan, y juntos terminaron el código de BackRub.
Pero aún necesitaban algo más: un algoritmo que fuese capaz de recoger los datos devueltos por su indexador web para transformarlos en una medida de la relevancia de cada página. Este fue el germen de PageRank. Pero, ¿cómo funciona? Su estrategia esencialmente consiste en contar el número de hiperenlaces que recibe una página determinada y asignarle como resultado un peso proporcional al número de enlaces. Ese valor refleja su relevancia. Una página en particular será más relevante que otra si el número de referencias que recibe, y, por tanto, el peso calculado por PageRank, es mayor.
La idea que subyace bajo el algoritmo de Page y Brin es esta, pero, en realidad, su base matemática es más compleja. De hecho, lo que devuelve PageRank es una distribución probabilística que se utiliza para representar la probabilidad de que una persona llegue a una página web concreta haciendo clic al azar sobre un conjunto de hiperenlaces de la Web. No es necesario que profundicemos más en la base matemática de este algoritmo para intuir con cierta claridad cuál fue la estrategia de Brin y Page, pero, si no os dejáis intimidar por las matemáticas, puede resultaros interesante saber que esta es la ecuación que describe el comportamiento de PageRank:
El motor de búsqueda que desencadenó el nacimiento de Google fue la consecuencia inevitable del correcto funcionamiento de BackRub y PageRank. Page y Brin escribieron el código de su motor en 1996 y decidieron ponerlo a prueba en la red de Stanford. Una vez que comprobaron la alta eficiencia de su algoritmo se dieron cuenta de que tenía mucho potencial como una herramienta comercial, así que un año más tarde lo lanzaron más allá de la red de la universidad en la que lo habían desarrollado. El resto, es historia.
PageRank ha demostrado ser una idea brillante que, sin duda, ha contribuido al éxito de Google. Pero el asombroso crecimiento del motor de búsqueda diseñado por Serguéi Brin y Larry Page no puede explicarse únicamente ciñéndonos a un algoritmo. Hay otros factores igualmente importantes que resultan mucho más difíciles de desvelar. De hecho, Page se inspiró en AltaVista, que también contaba enlaces, cuando se le ocurrió la idea de escribir PageRank.
La situación en la que se encontraba el mercado de los buscadores en ese momento también pudo condicionar su éxito. Y, cómo no, la desmesurada fuerza de voluntad de Page y Brin influyó, no cabe duda. Incluso la suerte juega una baza importante en el nacimiento de una nueva empresa.
Algunos de los competidores de Google a principios de la década pasada, como Louis Monier, cofundador de AltaVista; Robert Davis, antiguo director general de Lycos; o Eric Brewer, profesor en Berkeley y uno de los artífices del motor de búsqueda Inktomi, estaban de acuerdo en que el abrumador éxito de Google no podía explicarse solo a través de PageRank. Pero esta es una ecuación que probablemente ni siquiera Brin y Page han sido capaces de resolver. Al menos en su totalidad…
Imagen de la línea de tiempo | Wikipedia
En Xataka | Dos de tres casos perdidos por Google ante la UE: falta el veredicto del caso AdSense
Ver 22 comentarios