ByteDance está extrayendo información web de forma masiva y automatizada a un ritmo rapidísimo
Lo hace para entrenar a sus modelos con los que posicionarse como el gigante chino de la IA
También está desarrollando sus propios chips para reducir la dependencia de proveedores extranjeros
ByteDance, la empresa matriz de TikTok, está en plena carrera de la IA, o al menos entrando en ella. Y lo está haciendo con una estrategia doble: desarrollando sus propios chips, una idea que lleva más de tres años en marcha, y también recopilando datos con el que entrenar su futuro modelo.
Por qué es importante. La IA generativa está siendo dominada por OpenAI y Google, de momento, con el permiso de NVIDIA en el terreno del hardware. Si TikTok entra en ella con la suficiente fuerza haría tambalear el equilibrio de fuerzas que hemos visto hasta ahora.
La panorámica. ByteDance está 'escrapeando' la web a un ritmo muy superior al que toda una OpenAI nos tenía acostumbrados, según ha publicado Quartz. Es decir, extrayendo y organizando la información online de manera automatizada y masiva.
Lo hace para conseguir la cantidad suficiente de datos con la que entrenar sus propios modelos de IA, y mientras desarrolla sus propios chips para reducir su dependencia de proveedores extranjeros, algo especialmente sensible para una empresa china.
En cifras:
- Bytespider, el web scraper de ByteDance, es 25 veces más rápido que GPTbot, de OpenAI...
- ...y 3.000 veces más veloz que ClaudeBot, de Anthropic.
- ByteDance ha encargado más de 100.000 chips Ascend 910B de Huawei este año para reemplazar a los de NVIDIA.
El contexto. Las restricciones de Estados Unidos a la exportación de chips especializados en IA han obligado a las empresas chinas a buscar alternativas nacionales y a desarrollar su propia tecnología. Ya lo hacían, pero las sanciones obligan a llevarlo más allá.
ByteDance está diseñando dos chips de IA con TSMC y tiene planes para llevarlos a la producción masiva para el año 2026.
Entre líneas. ByteDance ya ha conseguido varios logros respecto a la IA:
- En agosto de 2023 lanzaron el chatbot Doubao.
- En mayo de 2024 anunciaron modelos Doubao para empresas.
- Este año también han presentado dos modelos de IA enfocados en el fuerte de la empresa: el vídeo.
Este ritmo de desarrollo y scrapeo por parte de ByteDance apuntan en una dirección clara: quieren postularse como un verdadero gigante chino de la IA, no simplemente como una cara B de TikTok dedicada a ella. Lo que venga a nivel regulatorio y ético será cuestión del futuro.
En Xataka | Hay más "unicornios” que nunca. En los últimos 20 años casi ninguno se ha convertido en un verdadero gigante
Imagen destacada | Solen Feyissa en Unsplash
Ver todos los comentarios en https://www.xataka.com
VER 3 Comentarios