Si te interesa el arte generativo y las herramientas de IA para generar arte como Disco Diffusion... ¡No te pierdas este artículo!
¿Qué es Disco Diffusion?
Disco Diffusion es una técnica que trabaja como modelador de imágenes mediante Inteligencia Artificial.
Podemos modificar la configuración de nuestra imágen, como el tamaño y la relación de aspecto. Lo más importante es el texto de entrada o Prompt. De esta manera vamos a escribir una descripción de la futura imagen. Indicamos a Disco Diffusion que nos dibuje lo que queremos (o algo parecido xD).
En este artículo voy a intentar organizar todo lo referente a Disco Diffusion, juntarlo y entregarlo de tal manera que se recoja toda la información disponible que he ido recopilando como tutoriales en video, ejemplos de imágenes generadas por IA, links oficiales y útiles, parámetros, etc.
👀 Links Oficiales:
Tutorial Básico de Disco Diffusion en español: Desplegando Google Colab
#Parte 1
#Parte 2
Parámetros y configuración de Disco Diffusion:
Configuración | Descripción |
---|---|
Your vision: | |
text_prompts | Una descripción de lo que te gustaría que la máquina generara. Piense en ello como si escribiera el pie de foto debajo de su imagen en un sitio web. |
image_prompts | Piensa en estas imágenes más bien como una descripción de su contenido. |
Image quality: | |
clip_guidance_scale | Controla cuánto debe parecerse la imagen a la indicación. |
tv_scale | Controla el suavizado de la salida final. El suavizado se utiliza para reducir el ruido o para producir una imagen menos pixelada. |
range_scale | Controla el grado de desviación de los valores RGB. |
sat_scale | Controla la cantidad de saturación permitida. Del cuaderno JAX de nshepperd. La saturación hace que cada color sea más vivo (menos color blanco o negro en la imagen). |
cutn | Controla cuántos recortes tomar de la imagen. |
cutn_batches | Acumula el gradiente del CLIP a partir de múltiples lotes de recortes. |
Init settings: | |
init_image | URL o ruta local |
init_scale | Esto aumenta el efecto de la imagen init, un buen valor es 1000 |
skip_steps | Controla el punto de inicio a lo largo de los tiempos de difusión. Cuántos pasos queremos saltar. |
perlin_init | Opción de comenzar con ruido perlin aleatorio |
perlin_mode | ('gris', 'color') |
Advanced: | |
skip_augs | Controla si se omiten los aumentos de la antorcha |
randomize_class | Controla si la clase de imagenet se cambia aleatoriamente en cada iteración |
clip_denoised | Determina si CLIP discrimina una imagen ruidosa o denotada |
clamp_grad | Experimental: Uso de la gradación adaptativa del clip en el cond_fn |
seed | Elige una semilla aleatoria y la imprime al final de la ejecución para su reproducción |
fuzzy_prompt | Controla si se añaden múltiples avisos ruidosos a las pérdidas de avisos |
rand_mag | Controla la magnitud del ruido aleatorio |
eta | Hiperparámetro DDIM |
use_vertical_symmetry | Hacer cumplir la simetría sobre el eje x de la imagen en [tr_st*pasos para tr_st en transformación_pasos] pasos del proceso de difusión |
use_horizontal_symmetry | Hacer cumplir la simetría sobre el eje Y de la imagen en [tr_st*pasos para tr_st en transformación_pasos] pasos del proceso de difusión |
transformation_steps | Pasos (expresados en porcentajes) en los que se aplica la simetría |
video_init_flow_warp | Deformación de flujo activada |
video_init_flow_blend | 0 - se obtiene la entrada sin procesar, 1 - se obtiene el fotograma anterior difuminado |