Dreambooth: qué es y cómo funciona esta tecnología para entrenar a una inteligencia artificial

Vamos a explicarte qué es y cómo funciona Dreambooth, una tecnología con la que vas a poder entrenar a distintos tipos de inteligencia artificial. Se trata de un sistema en cuya creación ha participado Google, y que es una auténtica revolución que está ayudando a que las IA modernas puedan crear imágenes alucinantes.

Vamos a intentar explicártelo todo de forma lo más sencilla posible. Primero te diremos qué es exactamente Dreambooth, y luego pasaremos a decirte cómo funciona. Al final, te daremos algunas notas sobre cómo y cuándo puedes usarlo.

Qué es Dreambooth

Dreambooth es un modelo de generación de aprendizaje profundo, y que fue desarrollado en 2022 por un grupo de investigadores de Google Research y la Universidad de Boston. La misión de esta tecnología es la de poder entrenar a modelos de inteligencia artificial para personalizarlo según tus necesidades.

Imagínate que tienes una IA como Stable Diffusion, capaz de generar imágenes a partir de texto. Pues bien, las imágenes que genera depende de cómo esté entrenada la inteligencia artificial, y Dreambooth lo que te permite es algo parecido a darle una nueva capa de entrenamiento o un añadido a esa IA para que pueda reconocer objetos concretos.

De esta manera, puedes hacer que una inteligencia artificial sea entrenada para reconocer sujetos concretos, ya sea personas, objetos o estilo. De esta manera, no solo podrás pedirle a una IA que te dibuje la cara de un hombre pensando, yo puedo pedirle que dibuje la cara de Yúbal pensando.

En Xataka Basics te hemos enseñado cómo entrenar a una IA para que haga imágenes con tu cara. Pues bien, lo primero que tienes que hacer para conseguirlo es entrenar a una IA para que reconozca tu cara, y esta es una de las cosas que puedes hacer con Dreambooth, siendo este el primer paso de ese proceso.

Dreambooth va a necesitar un set de unas 8 o 10 imágenes para empezar a entrenar con ellas a la IA y crear un modelo entrenado para reconocer ese sujeto que hayas incluido.

Cómo funciona Dreambooth

El funcionamiento de esta técnica funciona en tres pasos. En primer lugar, necesitas un modelo de difusión preentrenado, que es uno de esos sistemas de inteligencia artificial que pueden crear imágenes a partir de texto. Por ejemplo, se puede usar Stable Diffusion u otros similares como DALL-E o Midjourney, siempre y cuando funcionen con el proceso de ruido y denoising.

Lo que hace esta técnica es primero crear una imagen completamente ruidosa, y luego ir quitando ese ruido reconstruyendo en el proceso una imagen totalmente original que se parezca a lo que le has pedido por texto. Pues es en este punto en el que Dreambooth ayudará con un modelo entrenado para que puedas obtener imágenes de sujetos concretos.

Y es ahí donde llega el segundo paso, en el que necesitas un conjunto de imágenes del sujeto con el que quieres personalizar la IA. Puede ser un estilo, una cara, o lo que sea. Se recomienda tener un set de unas 8 o 10 imágenes como mínimo para poder entrenar el modelo.

Entonces, lo que hace Dreambooth es utilizar este set de imágenes para entrenar al modelo de difusión, entrenar a la IA para que sepa reconocer lo que hay en ellas. Puede reconocer tu cara para luego poder dibujarla desde cero, así como un estilo o una posición.

Una vez has usado Dreambooth para entrenar a la IA, este sistema usará las imágenes del sujeto como punto de partida para el proceso de crear la imagen aleatoria, permitiendo que la IA tenga más información sobre cómo es el sujeto que quieres dibujar, y que así pueda hacer imágenes que se parezcan a él.

Cómo usar Dreambooth

Dreambooth no es un sistema que puedes descargar e instalar en tu ordenador. Es un sistema de entrenamiento creado por ingenieros de Google, pero tampoco es algo que puedes simplemente usar. Su página web oficial está en Github, y es solo una ficha técnica con la información sobre cómo funciona.

Lo que tienes que hacer es buscar algún programa creado para entrenar una IA concreta con Dreambooth. Nosotros en su día utilizamos esta plantilla de Google Colab para entrenar a Stable Diffusion con Dreambooth, cuyo código está en Github.

Por lo tanto, Dreambooth es solo una pieza dentro de un proceso mayor que constará de varios pasos para personalizar tu IA. Por lo tanto, una vez hayas elegido un tipo de IA que quieras entrenar y sepas con qué tipo de sujeto quieres hacerlo, tendrás que buscar un modelo de Dreambooth preparado para ello.

Ver todos los comentarios en https://www.xataka.com

VER 0 Comentario

Portada de Xataka