Instala en tu PC modelos generativos de imágenes con IA Stable Diffusion gratuitos 1

Instala en tu PC modelos generativos de imágenes con IA Stable Diffusion gratuitos

Descubre cómo generar imágenes con IA desde tu PC, usando modelos gratuitos y de código abierto como Stable Diffusion, y aprende a crear imágenes consistentes y realistas.

Todos hablan de ello, todos lo prueban, pero, ¿cómo funciona realmente la generación de imágenes a través de IA? Porque por un lado, ir a uno de los numerosos sitios que crean imágenes y pedir ver un atardecer o un paisaje o una persona al azar, es una cosa, pero generar un conjunto de imágenes similares o consistentes que representan quizás el mismo sujeto, es otra cuestión.

Además, otra pregunta que surge de manera espontánea y que es incluso más práctica, ¿podemos generar imágenes nuevas, de fantasía o realistas, sin utilizar servicios externos, pero solo usando nuestro PC y quizás también de forma gratuita, sin créditos y diversas limitaciones y censuras?

Si escribo este artículo, está claro que podemos generar todas las imágenes que queramos, incluso consistentes, desde nuestro PC utilizando modelos de generación libres y de código abierto.

 

Premisa

Antes de llegar a cómo hacerlo, sin embargo, es realmente necesario entender dos o tres conceptos para saber qué estamos haciendo; de lo contrario, solo se usará una herramienta al azar que nunca dará los resultados esperados. Será un discurso super sintético, esencial.

Entonces, volviendo al tema de la guía para instalar una IA en el PC, si para los chats textuales solo se necesita un modelo lingüístico o LLM, para la GenAI o inteligencia artificial generativa, necesitamos un modelo de Deep Learning (aprendizaje profundo), texto-imagen.

Ejemplos de estos modelos texto-imagen son los famosos DALL-E de Open AI, el primero en salir, luego Midjourney, de la cual hablé ampliamente hace tiempo, Grock de X, Imagen de Google y, sobre todo, el más importante para todos nosotros, Stable Diffusion.

Stable Diffusion, cuya historia y funcionamiento se puede leer en Wikipedia es el modelo de código abierto gratuito de difusión latente texto-imagen de Stability AI que todos pueden utilizar libremente. Stable Diffusion es también un modelo más ligero en comparación con DALL-E y Midjourney, instalable en nuestro PC y utilizado por la gran mayoría de sitios y aplicaciones web que ofrecen un servicio de generación de imágenes.

Requisitos de Stable Diffusion en PC

Agradeciendo entonces a los creadores de Stable Diffusion, quedan dos problemas para quienes desean experimentar con la IA generativa.

El primero es el costo en términos de memoria de video: para crear imágenes a través de IA es necesario contar con un PC que tenga al menos, para Stable Diffusion, 12 GB de memoria VRAM, la de la tarjeta gráfica. Por lo tanto, si realmente se quiere hacer todo en casa, será necesario comprar una tarjeta gráfica NVIDIA GeForce con mucha VRAM, al menos 12 GB, que como se ha visto, cuesta un mínimo de 600 euros (y a pesar de este gasto, tendremos justo lo mínimo necesario). Para realizar pruebas, también pueden ser suficientes 6 GB de VRAM, pero, de todos modos, este problema se puede resolver fácilmente sin comprar nada, usando la Nube, como veremos más adelante.

El segundo problema está relacionado con el aprendizaje de la IA. En resumen, si instalamos el software y luego pedimos crear la imagen de una chica, esta aparecerá con un cierto aspecto. La segunda vez aparecerá con un aspecto totalmente diferente y, de hecho, quizás aparecerá como un dibujo animado o como una figura digital en 3D. En esencia, es necesario darle un control a la IA para asegurarse de que las imágenes sean del mismo tipo. Para resolver esto, solo se necesita un poco de paciencia para entender y usar las herramientas.

Otros requisitos son puramente software. El PC debe tener instalado el intérprete Python y luego la herramienta Git

Descargar e Instalar Stable Diffusion en PC

Hay tres programas principales para instalar la IA de Stable Diffusion en su PC, todos ellos de código abierto y con un funcionamiento similar, con diferentes métodos de instalación y configuración. Estos son:

  • AUTOMATIC1111 o A1111, disponible para Mac y Windows, además de en la nube. La guía e instrucciones de uso están en el sitio StableDiffusion.art.
  • Fooocus, programa similar para Windows y Linux, que se puede descargar desde Github donde están presentes todas las.
  • Las instrucciones. Fooocus es bastante simple de usar porque también admite la generación de imágenes a partir de imágenes, por lo que se podrá cargar una foto propia o hacer un face swap.
  • ComfyUI, que no solo es el más potente de los programas, sino también el más sencillo, porque para este software hay un paquete para Windows que tiene todo incluido, por lo que no se requerirá ningún comando de configuración y podrá ser utilizado inmediatamente. Si tienes un PC con tarjeta gráfica NVIDIA, puedes descargar el programa ComfyUI_windows_portable_nvidia.7z de la página de lanzamientos, que solo debes descomprimir y ejecutar.

Como se podría notar en las páginas web de estos programas, si no tienes un PC lo suficientemente potente o si no quieres perder demasiado tiempo con la instalación manual, es posible ejecutarlos en la nube gracias a la plataforma Google Colab. Colab es, esencialmente, un servicio de Google que permite conectarse y alquilar un servidor de Google con 16 GB de VRAM en el que ejecutar comandos de Python. El acceso solo requiere una cuenta de Google Drive y es gratuito por un tiempo limitado. En Colab se pueden iniciar los programas (presionando el botón de Play junto a las líneas de comando):

ComfyUI también se puede ejecutar en la nube, completo con modelos y puntos de control, desde el sitio RunComfy.com, que permite alquilar una máquina virtual con 16 GB de VRAM de forma gratuita o también por alquiler, sin suscripción, pagando solo por el tiempo que se usa o por más memoria.

Agregar los modelos o checkpoints

Cualquiera que sea el programa que usemos, yo recomiendo ComfyUI o Fooocus, para generar imágenes es necesario cargar los llamados checkpoints, es decir, los modelos de IA que no están incluidos. Stable Diffusion es uno de estos modelos de IA, pero existen varios otros. Estos modelos de IA o checkpoints son archivos con formato .safetensors y deben ser descargados y ubicados en la carpeta de modelos (abre la carpeta del programa y luego abre la ruta models/checkpoint y copia allí los archivos .safetensors).

Los modelos safetensors se pueden descargar del sitio HuggingFace, que los reúne todos, o también en el sitio Civit.ai, que es menos técnico y completo, pero también más simple de navegar y buscar. Por ejemplo, puedes descargar Stable Diffusion XL 1.0 (en la página ve a File and versions para encontrar las descargas).

Como se podrá notar, el campo de las IA generativas de imágenes es un mundo terriblemente vasto, donde es fácil experimentar, pero requiere acumular mucha experiencia si se quiere hacer en serio. Para comenzar, yo recomendaría, si se quieren hacer imágenes realistas como fotografías, descargar el modelo Juggernaut XL en Civitai, basado en SD XL. Si quieres crear imágenes de anime o en gráficos 3D o de cualquier otro tipo, puedes descargar el checkpoint deseado también desde Civitai o Huggingface.

Sin embargo, la conversación sobre los modelos no termina aquí. Después de las primeras pruebas, sentirás que el modelo no es consistente y no respeta el prompt. Por esta razón, existen los llamados LORA (Low-Rank Adaptation), que son submodelos que limitan la variedad de la creación de imágenes para poder definir mejor lo que queremos y son necesarios para crear imágenes consistentes. Para entender mejor la historia, podemos pensar en los LORA como diferentes filtros de fotografía. Por ejemplo, si quisiéramos crear imágenes de una chica hermosa con piel perfecta, se podría descargar el LORA adecuado (Realism); si.

Si quisiéramos obtener imágenes de una persona famosa, como Billie Eilish, muy de moda, entonces deberíamos descargar el LORA. Civitai cuenta con una gran colección de LORA que pueden ser buscados y descargados gratuitamente.

También podemos crear un LORA a través del entrenamiento (básicamente, se deben subir 50 o 60 fotos del mismo sujeto o detalle) que se puede hacer también en línea en Civit.ai (aunque será necesario comprar al menos 5 euros de créditos).

Atención también al concepto de Workflow, que en ComfyUI se representan como diagramas de flujo. Los workflows son los pasos que debe seguir el algoritmo (a través de checkpoints, LORA y muchos otros parámetros) para generar la imagen y pueden llegar a ser realmente complejos. En el sitio Runcomfy.com se pueden descargar muchos workflows listos.

Stable Diffusion en línea

Quien no tenga un PC con 12 GB de VRAM, puede probar estos programas, pero la generación de imágenes será bastante lenta. Por suerte, existen servicios en línea. Ahora, hay muchísimos servicios en línea que integran Stable Diffusion. Estos no hacen más que cargar en sus servidores el programa de código abierto, por ejemplo, ComfyUI, bien configurado con Checkpoint y LORA, solicitando suscripciones.

Hemos hecho una pequeña lista de los mejores sitios para generar imágenes mediante IA gratuitamente en otro artículo.

De las investigaciones realizadas, encontré como mejores en absoluto a los sitios Civit.ai y Tensor.art, porque son como versiones en línea de ComfyUI, completas con todos los checkpoints y LORA más usados y porque, en términos de consumo de créditos, están entre los más generosos y se pueden usar gratuitamente para hacer muchas pruebas y no solo 5 o 10 imágenes.

Flux

Dos palabras también sobre Flux de Black Forest Lab, otro modelo generativo de IA Text-to-Image de código abierto, similar a Stable Diffusion, pero más reciente y con una calidad superior. En los sitios mencionados anteriormente se puede intentar crear imágenes mediante Flux y comparar las generadas a través de SD XL o SD 1.5. Aunque es mejor, Flux es también más "costoso" tanto en términos de memoria de video (se necesitan al menos 16 GB de VRAM en el propio PC para Flux) como en términos de precio de los servicios en línea.

La forma más sencilla de probar Flux gratis es desde el sitio Hugging Face. Al presionar sobre Flux.1 Dev se abre la página donde es posible escribir el prompt o cargar una imagen para obtener una nueva.

Escritura del texto o prompt

Mucho contenido en este artículo e imagino cuántas más búsquedas de guías realizará quien se interese, de todas formas, si hemos logrado configurar el programa en el PC o si nos hemos inscrito en un servicio en línea para ir más rápido, ahora llega la parte más difícil: la escritura del prompt. Sí, porque para generar una imagen bien hecha, realista o de fantasía, es necesario describirla con todos los detalles en el prompt, de lo contrario saldrá mal o no será precisa.

En esto nos ayuda la IA normal, ChatGPT o, mejor aún, Google Gemini, que funciona bien en la generación de prompts textuales. Se puede abrir Gemini Studio y luego preguntar algo como "generate prompt for stable Diffusion for a photorealistic image of a woman.... ". La salida se podrá luego pegar en la herramienta de generación de imágenes. Solo asegúrate de escribir los prompts en inglés, esto es realmente obligatorio.

Un excelente sitio para encontrar prompts listos para copiar y pegar para StableDiffusion y Flux es prompthero.com.

También recuerdo que es posible utilizar las IA generativas para cambiar la cara en una foto con FaceSwap, operación que ha evolucionado mucho en el último año.

Para finalizar, respondo a una última pregunta: ¿Podemos también generar videos en la PC mediante IA?

La respuesta, esta vez, es negativa, aún es demasiado pronto para hablar de eso. Para empezar, el modelo gratuito Stable Video Diffusion acaba de salir y aún no funciona muy bien. Además, para generar videos se necesita aún más memoria de video, por lo que puede volverse realmente costoso.

En la generación de videos, los que están más avanzados son los servicios Kling, Hailuo, Hedra, Pika y Runway, mencionados en la lista de.

sitios para generar videos mediante IA

Si tienen dificultades o preguntas, dado que el tema es complejo y está en constante evolución, háganlo saber.

Respuestas a tus Preguntas comunes

¿Cómo usar Stable Diffusion en mi PC?

Para utilizar Stable Diffusion en tu PC, sigue estos pasos sencillos:

 

  • Instala Python y Git: Asegúrate de tener instalada la última versión de Python y Git en tu computadora.
  • Crea cuentas: Regístrate en GitHub y Hugging Face si no tienes cuentas aún. Esto es necesario para acceder a los repositorios y modelos.
  • Clona la Web-UI: Utiliza Git para clonar la interfaz web de Stable Diffusion en tu ordenador. Puedes hacerlo ejecutando el comando adecuado en tu terminal.
  • Descarga el modelo: Obtén la última versión del modelo de Stable Diffusion desde Hugging Face. Asegúrate de seguir las instrucciones para la descarga.
  • Configura la Web-UI: Ajusta la configuración necesaria en la Web-UI según tus preferencias. Esto puede incluir la ruta del modelo.
  • Ejecuta Stable Diffusion: Inicia la Web-UI y sigue las instrucciones en pantalla para generar imágenes utilizando Stable Diffusion. Con estos pasos, podrás ejecutar Stable Diffusion en tu PC de manera eficiente y comenzar a crear imágenes.

 

¿Es Stable Diffusion gratuito para descargar?

Sí, Stable Diffusion es gratuito para descargar. A continuación, algunos puntos clave:

    • -

Código abierto

    : Stable Diffusion es una serie de modelos de código abierto proporcionados por Stability AI.

  • Acceso: Cualquiera puede acceder y utilizar estos modelos.
  • Uso personal: Los modelos están disponibles para su descarga sin costo, principalmente para uso personal.
  • Desarrollo: Además, los usuarios pueden desarrollar ideas y proyectos basados en estos modelos. En resumen, puedes descargar Stable Diffusion de forma gratuita y explorar su potencial creativo.

¿Cómo activar la IA en PC?

Para activar la inteligencia artificial en tu PC, sigue estos pasos:

 

  • Abre Configuración:
      - Dirígete a la opción de 'Configuración' en tu PC.
  • Accede a Información General:
  • Busca la sección 'Información general'.
  • Cambios de Características:
  • Haz clic en 'Cambios de características'.
  • Aprendizaje Automático:
  • Localiza la opción 'Aprendizaje automático'.
  • Programador Inteligente:
  • Selecciona 'Programador inteligente'.
  • Habilitar:
  • Ajusta el deslizador a 'Habilitado'. Siguiendo estos pasos, podrás activar la inteligencia artificial en tu PC y configurar las opciones de privacidad relacionadas.

 

¿Puedo generar imágenes de IA en mi PC?

Sí, puedes generar imágenes de IA en tu PC. Aquí te mostramos cómo hacerlo de manera sencilla:

    • -

Herramientas disponibles

    : Usa software como Image Creator en Microsoft Designer, que permite crear arte y fotos personalizadas.

  • Variedad de estilos: Esta herramienta es versátil y puede manejar diferentes estilos y formatos, adaptándose a tus necesidades específicas.
  • Usabilidad: Su interfaz amigable facilita la creación de imágenes para presentaciones, carteles o cualquier otro proyecto.
  • Requisitos: Solo necesitas acceso a una computadora compatible y a la aplicación deseada. Con estas herramientas, podrás generar ilustraciones únicas y de alta calidad en poco tiempo.

Si deseas encontrar artículos similares a Instala en tu PC modelos generativos de imágenes con IA Stable Diffusion gratuitos, te sugerimos revisar la categoría Inteligencia Artificial.

Índice
  1. Premisa
  2. Requisitos de Stable Diffusion en PC
  3. Descargar e Instalar Stable Diffusion en PC
  4. Agregar los modelos o checkpoints
  5. Stable Diffusion en línea
  6. Flux
  7. Escritura del texto o prompt
  8. Respuestas a tus Preguntas comunes
    1. ¿Cómo usar Stable Diffusion en mi PC?
    2. ¿Es Stable Diffusion gratuito para descargar?
    3. ¿Cómo activar la IA en PC?
    4. ¿Puedo generar imágenes de IA en mi PC?

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir