600+ Imágenes Generadas con IA: El Workflow Que Reemplazó a Nuestro Diseñador
En iAmanos hemos generado más de 600 imágenes con Google Imagen 4 en los últimos 6 meses. No para experimentar ni para demos — para producción real. Imágenes que ahora mismo están en apps, blogs y landing pages que ven miles de personas.
267 featured images para nuestra campaña SEO V2 (180 posts). 42 assets para el rediseño del Cotizador. 50 imágenes para GlamBook (salón de belleza). 206 fotos de razas de perros para WouWou. 40 más para IDI/CIP. Y decenas más para otras apps.
Todo generado con la misma herramienta: Google Imagen 4 a través del SDK @google/genai. Costo total: prácticamente $0 (free tier de Google AI Studio). Tiempo total de un humano generando manualmente: probablemente 400+ horas de trabajo de diseño.
Este artículo es el tutorial completo: cómo lo configuramos, los prompts que funcionan, las limitaciones reales, y el workflow que puedes replicar hoy.
Setup Técnico: Imagen 4 con @google/genai SDK
Google Imagen 4 es el modelo de generación de imágenes de Google, accesible a través de la API de Google AI Studio. No es DALL-E, no es Midjourney — es el mismo modelo que potencia las herramientas de diseño de Google.
Configuración básica
// Instalación
npm install @google/genai
// Uso básico
import { GoogleGenAI } from '@google/genai';
const ai = new GoogleGenAI({ apiKey: process.env.GOOGLE_AI_KEY });
const response = await ai.models.generateImages({
model: 'imagen-4.0-generate-001',
prompt: 'Clínica veterinaria moderna en Ciudad de México, interior luminoso, veterinaria mexicana atendiendo un golden retriever, fotografía profesional, 16:9',
config: {
numberOfImages: 1,
outputMimeType: 'image/jpeg',
},
});
// La imagen viene en base64
const imageData = response.generatedImages[0].image.imageBytes;
fs.writeFileSync('output.jpeg', Buffer.from(imageData, 'base64'));
Límites del free tier
- 70 imágenes/día: Suficiente para la mayoría de proyectos. Nosotros generamos en batches de 30-50 por sesión.
- Resolución: Hasta 1024×1024 nativo, pero puedes pedir aspect ratios específicos (16:9, 4:3, 9:16).
- Modelo:
imagen-4.0-generate-001es el más reciente y produce los mejores resultados fotorrealistas. - Costo: Gratis dentro del free tier. Después de 70/día necesitas billing habilitado.
La API key
Usamos una API key de Google AI Studio. Importante: las keys tienen cuotas por proyecto. Si llegas al límite con una key, puedes crear otra en un proyecto de Google Cloud diferente. Siempre en .env, nunca hardcodeada.
600+ Imágenes en Producción: Los Casos Reales
Caso 1: 267 featured images para SEO V2 (blog iamanos.com)
Nuestra campaña SEO V2 produjo 180 posts en 45 días. Cada post necesitaba una featured image única y relevante. Generamos 267 imágenes (algunas de reemplazo) con Imagen 4.
El workflow fue:
- Script Python que lee los títulos y temas de cada post del JSON
- Prompt engineering basado en el sector del post (salud, construcción, finanzas, etc.)
- Generación batch de 30 imágenes por sesión
- Compresión a max 1280px, calidad 72% JPEG (regla iAmanos)
- Upload a WordPress vía REST API con filename descriptivo y alt text SEO
- Asignación como featured image del post correspondiente
Tiempo total: ~8 horas de trabajo humano para 267 imágenes. Un diseñador profesional cobraría entre $50 y $200 USD por imagen — serían $13,350 a $53,400 USD. Nosotros: $0.
Caso 2: 42 assets para el Cotizador redesign
El rediseño del Cotizador iAmanos requirió:
- Iconos 3D para features (chatbot IA, hosting, dominio, etc.)
- Imágenes hero para cada tier de precio
- Mockups de apps para la sección de showcase
- Imágenes de proceso (4 pasos: cotizar → diseñar → construir → lanzar)
42 imágenes generadas en una sola sesión. Todas con estilo consistente gracias a prompts que especifican paleta de colores, estilo fotográfico, y composición.
Caso 3: 50 imágenes para GlamBook (salón de belleza)
GlamBook necesitaba imágenes que transmitieran la estética L’Oréal: elegancia, lujo accesible, tonos ivory/onyx/gold. Generamos:
- Fotos de servicios (corte, color, uñas, facial, etc.)
- Retratos de staff (estilistas ficticios con look profesional)
- Ambientes de salón (recepción, estaciones de trabajo, área de lavado)
- Productos y herramientas
El reto fue mantener consistencia visual entre 50 imágenes para que parecieran del mismo salón. La solución: incluir elementos constantes en cada prompt (iluminación cálida, muebles de madera clara, plantas decorativas, paleta ivory/gold).
Caso 4: 206 razas de perros para WouWou
Este fue el proyecto más ambicioso. WouWou tiene fichas detalladas de 206 razas de perros, cada una con su imagen. Generamos todas con Imagen 4, logrando fotos fotorrealistas de cada raza.
El desafío: Imagen 4 necesita prompts muy específicos para generar razas correctamente. “Golden Retriever” funciona bien. “Xoloitzcuintle” requiere más contexto descriptivo porque el modelo lo conoce menos. Escribimos prompts customizados para cada raza describiendo sus características físicas distintivas.
Prompt Engineering: Los Prompts Que Generan Imágenes Profesionales
Después de generar 600+ imágenes, hemos destilado los principios de prompting que producen los mejores resultados:
Principio 1: Sé específico sobre el estilo fotográfico
En lugar de: “oficina moderna”
Usa: “Interior de oficina corporativa moderna en Ciudad de México, cristales panorámicos con vista a la ciudad, escritorio minimalista blanco, planta monstera, iluminación natural suave, fotografía editorial 16:9, estilo arquitectura mexicana contemporánea”
Principio 2: Incluye contexto mexicano
Imagen 4 genera imágenes con sesgo hacia contextos estadounidenses/europeos por default. Para que las imágenes se vean mexicanas:
- Menciona “Ciudad de México” o “México” explícitamente
- Incluye elementos culturales (colores mexicanos, arquitectura, vegetación)
- Especifica tonos de piel cuando generas personas
- Referencia calles, edificios o ambientes reconociblemente mexicanos
Principio 3: Especifica composición y aspect ratio
Siempre incluimos en el prompt:
- “16:9” para hero images y featured posts
- “centered composition” o “rule of thirds” para composición predecible
- “negative space on left/right” cuando necesitamos espacio para texto overlay
- “professional photography, high quality, sharp focus” como calificadores de calidad
Principio 4: Batch con variaciones
Para mantener consistencia visual en un batch de imágenes (como las 50 de GlamBook), creamos un “prompt base” con los elementos constantes y solo variamos el sujeto:
// Prompt base GlamBook
const BASE_PROMPT = `Elegant beauty salon interior, warm ambient lighting,
ivory and gold color palette, modern luxury aesthetic,
professional photography, 16:9 aspect ratio`;
// Variaciones
const SERVICES = [
`${BASE_PROMPT}, professional hairstylist cutting woman's hair`,
`${BASE_PROMPT}, manicure station with nail polish collection`,
`${BASE_PROMPT}, facial treatment in spa room`,
];
Principio 5: Prompts por sector
Tenemos un catálogo de 55 prompts organizados por sector (salud, construcción, finanzas, tecnología, etc.) que usamos como base para las imágenes del blog. Cada sector tiene su paleta de colores, estilo visual, y elementos recurrentes.
Las Limitaciones Reales de Imagen 4 (Que Nadie Te Dice)
Limitación 1: Texto en imágenes — no funciona
Si tu prompt incluye texto que debería aparecer en la imagen (un letrero, un logo, texto en pantalla), el resultado va a ser ilegible o incorrecto. Los modelos de generación de imágenes todavía no manejan texto bien. Nuestra solución: generar la imagen sin texto y agregar texto después con CSS overlay o un editor.
Limitación 2: Menores — rechazo silencioso
Si tu prompt menciona niños o menores de edad, Imagen 4 puede rechazar la solicitud sin dar un error claro. Simplemente no genera la imagen o devuelve una imagen genérica. Esto aplica incluso para contextos completamente inocentes (“niño jugando con un perro en un parque”).
Limitación 3: Consistencia entre imágenes
No hay forma de decirle a Imagen 4 “genera una imagen igual a esta pero con diferente ángulo”. Cada generación es independiente. Para mantener consistencia visual, dependes 100% del prompt. A veces funciona perfecto, a veces obtienes estilos inconsistentes.
Limitación 4: Anatomía de manos y dedos
Mejor que hace un año, pero todavía genera manos con 6 dedos o posiciones anatómicamente imposibles en ~10% de las imágenes. Revisamos cada imagen manualmente antes de usarla.
Limitación 5: Rate limiting estricto
70 imágenes/día en free tier. Si estás generando un batch grande, necesitas dividir en sesiones de múltiples días o tener múltiples API keys.
SEO de Imágenes: Cómo Optimizamos Cada Imagen para Google
Generar la imagen es solo la mitad del trabajo. La otra mitad es optimizarla para SEO:
Filename descriptivo
Nunca usamos nombres genéricos como Gemini_Generated_1.jpeg o IMG_0234.jpeg. Cada imagen tiene un nombre descriptivo con guiones: clinica-veterinaria-moderna-cdmx.jpeg, salon-belleza-interior-lujo.jpeg.
Alt text contextual
Cada imagen tiene alt text que describe lo que se ve Y incluye la keyword relevante del post: “Interior de clínica veterinaria moderna en Ciudad de México con veterinaria atendiendo paciente canino”.
Compresión obligatoria
Regla iAmanos: máximo 1280px de ancho, calidad 72% JPEG. Esto reduce el peso de ~2 MB a ~100-200 KB sin pérdida de calidad visible. Más rápido de cargar = mejor Core Web Vitals = mejor ranking en Google.
Una imagen por post
Nunca reutilizamos la misma imagen en múltiples posts. Cada post tiene su imagen única. Google penaliza contenido duplicado, incluyendo imágenes.
Workflow Batch: Cómo Generamos 30 Imágenes en una Sesión
Nuestro proceso para generar imágenes en batch está automatizado con scripts Python:
# Pseudo-código del batch generator
import google.generativeai as genai
from PIL import Image
import io, os
genai.configure(api_key=os.environ['GOOGLE_AI_KEY'])
posts = load_posts_json('posts_day31_to_day45.json')
for post in posts:
prompt = generate_prompt(post['title'], post['sector'])
response = genai.ImageGenerationModel('imagen-4.0-generate-001').generate_images(
prompt=prompt,
number_of_images=1,
aspect_ratio='16:9'
)
image = Image.open(io.BytesIO(response.images[0]._pil_image))
# Compresión: max 1280px, 72% quality
image.thumbnail((1280, 720))
filename = f"{post['slug']}.jpeg"
image.save(filename, 'JPEG', quality=72)
# Upload a WordPress
wp_media_id = upload_to_wordpress(filename, post['alt_text'])
set_featured_image(post['wp_id'], wp_media_id)
print(f"✓ {post['title']} → Media ID: {wp_media_id}")
time.sleep(2) # Rate limiting
30 imágenes generadas, comprimidas, subidas a WordPress y asignadas como featured images en ~45 minutos. Todo automatizado excepto la revisión visual final (revisamos cada imagen en WordPress antes de publicar).
Alternativas a Imagen 4: Cuándo Usar Otra Herramienta
- DALL-E 3 (OpenAI): Mejor para ilustraciones estilizadas y conceptuales. Peor para fotorrealismo. Más caro ($0.04-0.08 por imagen).
- Midjourney: El mejor para arte visual y composiciones creativas. No tiene API programática fácil de integrar.
- Stable Diffusion (local): Control total, pero requiere GPU local y mucho tuning. Ideal si necesitas generar miles de imágenes sin límites.
- Imagen 4 (Google): Nuestro preferido por: API limpia, 70 imágenes/día gratis, excelente fotorrealismo, integración directa con SDK de Google.
Para el 95% de los casos de uso en producción web (featured images, assets de UI, mockups), Imagen 4 es la mejor relación calidad-precio. Es lo que usamos en todas las apps que construimos en iAmanos.
Comparativa de Costos: IA vs Diseñador vs Stock Photos
Para que dimensiones el ahorro real, aquí está la comparativa de costos para generar los assets visuales de una app típica (30-50 imágenes):
Opción 1: Diseñador gráfico freelance en México
- Costo por imagen custom: $500-2,000 MXN ($25-100 USD)
- 40 imágenes: $20,000-80,000 MXN ($1,000-4,000 USD)
- Tiempo de entrega: 2-4 semanas
- Revisiones: 2-3 rondas incluidas, más costo adicional
- Calidad: alta, personalizada, con dirección artística humana
Opción 2: Fotos de stock (Shutterstock, Adobe Stock)
- Suscripción mensual: $30-80 USD (10-50 descargas)
- 40 imágenes: ~$50-100 USD en suscripción
- Tiempo: inmediato (pero buscar la foto correcta toma horas)
- Problema: imágenes genéricas que tu competencia también usa
- Problema México: pocas fotos con contexto mexicano real
Opción 3: Google Imagen 4 (nuestro modelo)
- Costo: $0 (free tier, 70/día)
- 40 imágenes: $0
- Tiempo: 2-3 horas incluyendo prompt engineering y compresión
- Calidad: fotorrealista, custom, con contexto mexicano si lo pides
- Limitación: necesitas saber hacer prompts y revisar resultados
La diferencia económica es abismal. Y la calidad de Imagen 4 en 2026 ya rivaliza con fotografía de stock profesional para la mayoría de los casos de uso en apps web.
7 Errores Comunes al Usar IA Para Generar Imágenes de Apps
1. No especificar aspect ratio
Si no dices 16:9, Imagen 4 genera cuadrado (1:1) por default. Las featured images de blog necesitan 16:9 para verse bien en cards. Los avatares necesitan 1:1. Las stories de redes sociales necesitan 9:16. Siempre especifica.
2. Prompts en inglés cuando necesitas contexto mexicano
Un prompt en inglés genera resultados con sesgo norteamericano. Aunque Imagen 4 entiende mejor los prompts en inglés, agrega siempre el contexto geográfico: “Mexican office”, “Ciudad de México skyline”, “Latin American professional”.
3. No comprimir antes de subir
Las imágenes generadas vienen en alta resolución (~2 MB). Si las subes directamente a tu app, destruyes los Core Web Vitals. Siempre comprime: max 1280px, 72% JPEG. De 2 MB a 150 KB sin pérdida visual.
4. Usar nombres de archivo genéricos
Google indexa los nombres de archivo de imágenes. output_1.jpeg no aporta nada al SEO. clinica-veterinaria-moderna-cdmx.jpeg posiciona en Google Images.
5. Omitir el alt text
Cada imagen necesita alt text descriptivo para accesibilidad y SEO. No un alt text genérico (“imagen”) sino uno que describa lo que se ve y contenga la keyword relevante.
6. Reutilizar imágenes entre posts o apps
Google penaliza contenido duplicado incluyendo imágenes. Cada post debe tener su imagen única. Con 70 imágenes gratis al día, no hay excusa para reutilizar.
7. No revisar manos y dedos
Imagen 4 ha mejorado pero todavía genera manos con anatomía incorrecta en ~10% de las imágenes. Siempre revisa visualmente antes de publicar. Una mano con 6 dedos destruye la credibilidad de tu app.
El Futuro de la Generación de Imágenes con IA para Apps
Lo que viene en los próximos 12 meses:
- Edición de imágenes existentes: Imagen 4 ya soporta inpainting (editar partes de una imagen). Pronto podrás decir “cambia el color de la pared a azul” o “agrega un logo en la recepción”.
- Consistencia de personajes: Generar el mismo personaje en múltiples poses y contextos. Crítico para crear staff de demo coherente.
- Texto legible en imágenes: El punto débil actual. Cuando los modelos generen texto nítido, podrás crear banners, infográficas y UI mockups completos sin Canva.
- Video corto: Google Veo y otros modelos ya generan video de 5-10 segundos. Para demos de apps y contenido de redes sociales, el video generado por IA reemplazará las capturas de pantalla estáticas.
En iAmanos ya estamos integrando estas capacidades conforme se vuelven disponibles. Cada app nueva tiene mejores assets visuales que la anterior porque la tecnología evoluciona semanalmente.
Integración Completa: De la Generación al Deploy en WordPress
Nuestro workflow de imágenes no termina con la generación. Aquí está el pipeline completo que usamos para los 267 featured images del blog:
Pipeline end-to-end
- Lectura del JSON de posts: Script Python carga el archivo JSON con títulos, slugs, y sectores de cada post
- Generación de prompt: Basado en el sector del post, selecciona el prompt base del catálogo de 55 prompts por sector y lo personaliza con el título específico
- Llamada a Imagen 4 API:
ai.models.generateImages()con modeloimagen-4.0-generate-001, aspect ratio 16:9 - Recepción de imagen: La API devuelve la imagen en base64. La decodificamos y guardamos como archivo temporal
- Compresión con Pillow: Resize a max 1280px de ancho, calidad 72% JPEG. El archivo baja de ~2 MB a ~150 KB
- Rename con slug: El archivo se renombra al slug del post:
inteligencia-artificial-sector-salud.jpeg - Upload a WordPress: POST a
/wp-json/wp/v2/mediacon el archivo y metadata (title, alt_text, caption) - Asignación como featured: POST a
/wp-json/wp/v2/posts/{id}confeatured_media: media_id - Registro en JSON de resultados: Guardamos media_id, filename, y URL para control de inventario
- Rate limit: 2 segundos de espera entre cada generación para respetar límites de la API
Este pipeline está 100% automatizado. Lo ejecutamos, nos vamos a tomar un café, y cuando volvemos tenemos 30 imágenes generadas, comprimidas, subidas y asignadas. El único paso manual es la revisión visual final — verificar que no haya manos defectuosas, composiciones raras, o textos ilegibles.
Organización de archivos
Mantenemos un directorio organizado por batch:
images/
├── days1-15/
│ ├── days1_3_results.json
│ └── [30 archivos .jpeg]
├── days16-30/
│ ├── days16_18_results.json
│ └── [30 archivos .jpeg]
├── days31-45/
│ ├── days31_33_results.json
│ └── [30 archivos .jpeg]
└── pillar-pages/
└── [10 archivos .jpeg]
Cada JSON de resultados contiene el mapeo completo: slug → filename → WP media ID → WP post ID. Esto permite auditar en cualquier momento qué imagen tiene cada post y regenerar si es necesario.
Si necesitas una app con imágenes profesionales generadas por IA, cotiza tu proyecto aquí.
Preguntas Frecuentes
¿Google Imagen 4 es realmente gratis?
Sí, dentro del free tier de Google AI Studio puedes generar hasta 70 imágenes por día sin costo. Para volúmenes mayores necesitas habilitar billing, pero el costo por imagen es mínimo (fracciones de centavo).
¿Las imágenes generadas con IA tienen problemas de copyright?
Las imágenes generadas con Imagen 4 son tuyas para uso comercial según los términos de Google AI. No infringen copyright de terceros porque son creaciones originales del modelo. Sin embargo, evita generar imágenes de personas reales o marcas registradas.
¿Se puede usar Imagen 4 para generar logos?
No recomendado. Los logos requieren precisión vectorial y texto legible — dos cosas que los generadores de imágenes no manejan bien. Para logos, mejor usar herramientas vectoriales o un diseñador humano.
¿Cuál es la mejor resolución para imágenes web generadas con IA?
Para featured images y heroes: 1280×720 (16:9) a 72% calidad JPEG. Esto produce archivos de 100-200 KB que cargan rápido. No necesitas más resolución para web — las pantallas muestran como máximo 1920px de ancho y la diferencia visual es imperceptible.
¿Imagen 4 genera personas de aspecto mexicano?
Sí, si lo especificas en el prompt. Incluye referencias como “Mexican professional”, “Ciudad de México context”, o describe tonos de piel específicos. Sin estas indicaciones, el modelo tiende a generar personas con apariencia caucásica por sesgo del training data.



