Hasta ahora NVIDIA estaba intratable en el mundo de los chips de IA para grandes empresas y centros de datos, pero Intel acaba de anunciar un producto que podría cambiar las cosas: el acelerador de IA Gaudi 3.
Este chip, aseguran en Intel, es capaz de ofrecer un 50% más de capacidad de inferencia y una media de un 40% de mejor eficiencia energética que el producto de referencia en este sector, los chips H100 de NVIDIA.
De hecho, en Intel presumen de que sus Gaudi 3 cuestan "una fracción" del coste de las gráficas especializadas H100, aunque no detallan exactamente la diferencia. Se sabe, eso sí, que las H100 de NVIDIA rondan fácilmente los 30.000 dólares.
Esta tarjeta aceleradora de IA, destacan sus responsables, se usará en grandes sistemas con decenas de miles de unidades interconectadas mediante conexiones Ethernet. Gaudi 3 es cuatro veces más potente en tareas IA y dispone de 1,5 veces más de ancho de banda de memoria que su predecesor.
La primera versión de Gaudi estaba fabricada con fotolitografía de 16 nm. Gaudi 2 hizo uso de procesos de 7 nm, pero en esta tercera generación se ha ido más allá y se usa fotolitografía de 5 nm, lo que permite integrar mayor número de transistores y ganar en potencia y eficiencia.
Su capacidad es desde luego prometedora, y en Intel aseguran que Gaudi 3 será capaz de ofrecer tiempos de entrenamiento un 50% mejores al usar modelos Llama 2 7B y 13B, además del GPT-3 de 175B de parámetros.
Estamos ante un mercado que está en plena ebullición: AMD ya presentó en diciembre sus propias tarjetas aceleradoras, las Instinct MI300X, que se sumaban a las APU Instinct MI300A y también planteaban una alternativa a las H100 de NVIDIA a una fracción del coste.
Por supuesto, en NVIDIA no se están quedando precisamente quietos y hace unos días conocíamos su nuevo chip B200 con arquitectura Blackwell. Este monstruo de 208.000 millones de transistores (el H100 tiene 80.000 millones) estará disponible en 2024, y sin duda replanteará la competencia en este sector.
Se espera que Gaudi esté disponible para OEMs como HP Enterprise (HPE), Lenovo y Supermicro en el segundo trimestre de 2024. No se han especificado precios de estas tarjetas aceleradoras.
Ver 1 comentarios