Facebook Pixel Code
Now Reading
Inteligencia Artificial: De Texto a Imagen con Midjourney

Inteligencia Artificial: De Texto a Imagen con Midjourney

Inteligencia Artificial De Texto a Imágen con Midjourney (1)

Nota del Autor: Este artículo es la 2da parte de nuestra serie sobre la exploración de la Inteligencia Artificial Generativa. Lee la parte anterior aquí y la siguiente parte aquí.

En Interesante, decidimos emprender un emocionante desafío: crear nuestro propio personaje utilizando únicamente herramientas de Inteligencia Artificial Generativa, específicamente el modelo de texto a imagen: Midjourney. Este artículo es la continuación de nuestra serie sobre el poder y las limitaciones de la IA en el ámbito creativo. Para una comprensión más completa, te recomendamos leer la primera parte de nuestra serie: ¿Qué es la IA?

Lecciones que aprendimos durante este proceso

  1. Descubrimos que controlar la creación de imágenes mediante la IA Generativa tiene límites. Aunque describimos con detalle lo que queríamos, los resultados eran a menudo impredecibles.
  2. Los modelos de lenguaje son poderosos, pero no son auto-suficientes para impulsar una marca. Se necesita trabajo adicional para lograr un acabado profesional.
  3. Midjourney tiende a filtrar indicaciones innecesarias, por lo que es clave experimentar y familiarizarse con el modelo.
  4. Aunque se detallen los elementos importantes, no siempre se garantiza un resultado óptimo en la imagen final. Midjourney puede producir resultados más variables de lo esperado.
  5. Agregar indicaciones «negativas» puede refinar la imagen, pero no asegura una precisión absoluta.

El Proceso Creativo

Para el proceso, queriamos que Midjourney nos generara una fotografía de una persona lo más auténtica posible, de aspecto real y replicable para diferentes situaciones. Para iniciar la creación de nuestro avatar decidimos utilizar ChatGPT cómo generador de ideas y co-creador visual del avatar.

Siguiendo este proceso, ChatGPT nos devolvió las siguientes preguntas que debíamos abordar para desarrollar completamente el Avatar:

  • ¿Tienes alguna preferencia para la apariencia o representación visual del Avatar?
  • ¿Tienes alguna preferencia para el lugar o representación visual del ambiente?
  • ¿Tienes alguna preferencia para la vestimenta?

Con esta guía inicial, volvimos a crear una lluvia de ideas y empezamos a dar forma a nuestro personaje. 

  • Nuestro Avatar:
    • Es mujer.
    • Tiene alrededor de 25-30 años.
    • Tiene características latinas: piel bronceada, cabello castaño, cabello rizado, ojos marrones, pestañas prominentes, cejas gruesas y una constitución normal.
AI Personaje
Avatar Referencial

Una vez tuvimos esta información clara iniciamos nuestro viaje con Midjourney. Durante todo el proceso, creamos alrededor de 10,000 imágenes. A continuación les presentamos nuestros resultados.

Generación de Imágenes con Midjourney

Para generar imágenes con Midjourney, hay que darle únicamente indicaciones de las características físicas y en los elementos visuales que se desea obtener en la imagen final. Indicaciones como “buena persona” “amable” “curiosa” no tienen una representación visual.

See Also
Cómo hornear tu propia startup
  • Tip: Midjourney entiende mejor el idioma inglés, por lo que recomendamos utilizar este lenguaje para generar mejores resultados. El uso de ChatGPT es ideal para realizar las traducciones de lo que deseas pedir y que genere un prompt útil que puedas utilizar en Midjourney.

Aprendimos que es necesario incluir un “prompt negativo” para cada iteración de generación de imágenes. Este prompt le permite a Midjourney evitar imágenes con mutaciones, desfiguraciones, partes duplicadas, etc.

Prompt Negativo usado en cada iteración con Midjourney

--no 3d, render, CGI, dool, painting, fake, cartoon, 3d modeling, worst quality, deformed, malformed, bad teeth, bad hands, bad fingers, bad eyes, long body, blurry, duplicated, cloned, duplicated body, duplicated body parts, disfigured, extra limbs, fused fingers, extra fingers, twisted, distorted, malformed hands, mutated hands, mutated fingers, conjoined, missing limbs, bad anatomy, bad proportions, logo, watermark, text, copyright, signature, lowres, mutated, mutilated, artifacts, gross, ugly

Prueba 1 con Midjourney: Personaje

Prompt para Midjourney

Photograph of a Latina woman. She has tanned skin, curly brown hair, and brown eyes highlighted by glasses. Her facial features include large eyelashes and prominent eyebrows.

Resultados de Midjourney

Prueba 2 con Midjourney: Ambiente

Prompt para Midjourney:

A white building, at the entrance of a coffee shop, photorealistic, national geography, hyper-realistic 

Resultados de Midjourney

Prueba 3 con Midjourney: Vestuario

Prompt para Midjourney:

“A latina woman wearing a blut shirt with white stripes and white pants”
“A latina woman wearing a green poncho, black shirt and green pants” 

Resultados de Midjourney

Análisis para la creación de imágenes con Midjourney

Este primer análisis de Midjourney resultó exitoso. Los resultados proporcionados por el modelo estuvieron estrechamente relacionados con las indicaciones solicitadas. El modelo entrega cuatro imágenes por cada indicación dada, lo que nos permitió obtener alrededor de 200 imágenes diferentes en total. Nuestro aprendizaje para la redacción de una indicación para Midjourney es la siguiente.

  1. Los elementos más importantes para la creación de cualquier tipo de imagen son los siguientes:
  • Determinar el sujeto: hombre, mujer, niño, animal, extraterrestre
  • Medio de la imagen: fotografía, pintura, ilustración, dibujo
  • Ambiente: interior, exterior
  • Iluminación: suave, cálida, de estudio
  • Color: blanco y negro, sepia, filtros
  • Estado de ánimo: tranquilo, enérgico
  • Composición: primer plano, cuerpo entero, toma aérea
  1. Para el tamaño, estilo y resolución, es necesario agregar los siguientes parámetros: 
  • Relación de aspecto (9:16)
  • Estilo: crudo 
  • Versión v 6.0

Tip: Estos parámetros se agregan al final de tu indicación escribiendo una doble barra seguida de la abreviatura del parámetro. Para entender detalladamente todos los parámetros disponibles y su uso, te recomendamos leer la documentación oficial de Midjourney que la encuentras en el siguiente enlace

Para la siguiente sección, vamos a profundizar más en nuestro análisis del funcionamiento del modelo de lenguaje y utilizaremos las diferentes herramientas que ofrece Midjourney para conseguir la creación de un personaje único de manera consistente.