Diseño con IA: Google Imagen 4 para Assets de Apps

Q: 600+ Imágenes Generadas con IA: El Workflow Que Reemplazó a Nuestro Diseñador

En iAmanos hemos generado más de 600 imágenes con Google Imagen 4 en los últimos 6 meses. No para experimentar ni para demos — para producción real. Imágenes que ahora mismo están en apps, blogs y landing pages que ven miles de personas.

Q: Principio 1: Sé específico sobre el estilo fotográfico

En lugar de: “oficina moderna”

En corto: Workflow completo de generación de imágenes con Google Imagen 4 vía @google/genai SDK. 70 imágenes/día gratuitas. Casos reales: 267 featured images para SEO V2,

600+ Imágenes Generadas con IA: El Workflow Que Reemplazó a Nuestro Diseñador

En iAmanos hemos generado más de 600 imágenes con Google Imagen 4 en los últimos 6 meses. No para experimentar ni para demos — para producción real. Imágenes que ahora mismo están en apps, blogs y landing pages que ven miles de personas.

Diseño con IA: Cómo Google Imagen 4 Genera los Assets de Nuestras Apps

267 featured images para nuestra campaña SEO V2 (180 posts). 42 assets para el rediseño del Cotizador. 50 imágenes para GlamBook (salón de belleza). 206 fotos de razas de perros para WouWou. 40 más para IDI/CIP. Y decenas más para otras apps.

Todo generado con la misma herramienta: Google Imagen 4 a través del SDK @google/genai. Costo total: prácticamente $0 (free tier de Google AI Studio). Tiempo total de un humano generando manualmente: probablemente 400+ horas de trabajo de diseño.

Este artículo es el tutorial completo: cómo lo configuramos, los prompts que funcionan, las limitaciones reales, y el workflow que puedes replicar hoy.

Setup Técnico: Imagen 4 con @google/genai SDK

Google Imagen 4 es el modelo de generación de imágenes de Google, accesible a través de la API de Google AI Studio. No es DALL-E, no es Midjourney — es el mismo modelo que potencia las herramientas de diseño de Google.

Configuración básica

// Instalación
npm install @google/genai

// Uso básico
import { GoogleGenAI } from '@google/genai';

const ai = new GoogleGenAI({ apiKey: process.env.GOOGLE_AI_KEY });

const response = await ai.models.generateImages({
  model: 'imagen-4.0-generate-001',
  prompt: 'Clínica veterinaria moderna en Ciudad de México, interior luminoso, veterinaria mexicana atendiendo un golden retriever, fotografía profesional, 16:9',
  config: {
    numberOfImages: 1,
    outputMimeType: 'image/jpeg',
  },
});

// La imagen viene en base64
const imageData = response.generatedImages[0].image.imageBytes;
fs.writeFileSync('output.jpeg', Buffer.from(imageData, 'base64'));

Límites del free tier

70 imágenes/día: Suficiente para la mayoría de proyectos. Nosotros generamos en batches de 30-50 por sesión.
Resolución: Hasta 1024×1024 nativo, pero puedes pedir aspect ratios específicos (16:9, 4:3, 9:16).
Modelo: imagen-4.0-generate-001 es el más reciente y produce los mejores resultados fotorrealistas.
Costo: Gratis dentro del free tier. Después de 70/día necesitas billing habilitado.

La API key

Usamos una API key de Google AI Studio. Importante: las keys tienen cuotas por proyecto. Si llegas al límite con una key, puedes crear otra en un proyecto de Google Cloud diferente. Siempre en .env, nunca hardcodeada.

600+ Imágenes en Producción: Los Casos Reales

Caso 1: 267 featured images para SEO V2 (blog iamanos.com)

Nuestra campaña SEO V2 produjo 180 posts en 45 días. Cada post necesitaba una featured image única y relevante. Generamos 267 imágenes (algunas de reemplazo) con Imagen 4.

El workflow fue:

Script Python que lee los títulos y temas de cada post del JSON
Prompt engineering basado en el sector del post (salud, construcción, finanzas, etc.)
Generación batch de 30 imágenes por sesión
Compresión a max 1280px, calidad 72% JPEG (regla iAmanos)
Upload a WordPress vía REST API con filename descriptivo y alt text SEO
Asignación como featured image del post correspondiente

Tiempo total: ~8 horas de trabajo humano para 267 imágenes. Un diseñador profesional cobraría entre $50 y $200 USD por imagen — serían $13,350 a $53,400 USD. Nosotros: $0.

Caso 2: 42 assets para el Cotizador redesign

El rediseño del Cotizador iAmanos requirió:

Iconos 3D para features (chatbot IA, hosting, dominio, etc.)
Imágenes hero para cada tier de precio
Mockups de apps para la sección de showcase
Imágenes de proceso (4 pasos: cotizar → diseñar → construir → lanzar)

42 imágenes generadas en una sola sesión. Todas con estilo consistente gracias a prompts que especifican paleta de colores, estilo fotográfico, y composición.

Caso 3: 50 imágenes para GlamBook (salón de belleza)

GlamBook necesitaba imágenes que transmitieran la estética L’Oréal: elegancia, lujo accesible, tonos ivory/onyx/gold. Generamos:

Fotos de servicios (corte, color, uñas, facial, etc.)
Retratos de staff (estilistas ficticios con look profesional)
Ambientes de salón (recepción, estaciones de trabajo, área de lavado)
Productos y herramientas

El reto fue mantener consistencia visual entre 50 imágenes para que parecieran del mismo salón. La solución: incluir elementos constantes en cada prompt (iluminación cálida, muebles de madera clara, plantas decorativas, paleta ivory/gold).

Caso 4: 206 razas de perros para WouWou

Este fue el proyecto más ambicioso. WouWou tiene fichas detalladas de 206 razas de perros, cada una con su imagen. Generamos todas con Imagen 4, logrando fotos fotorrealistas de cada raza.

El desafío: Imagen 4 necesita prompts muy específicos para generar razas correctamente. “Golden Retriever” funciona bien. “Xoloitzcuintle” requiere más contexto descriptivo porque el modelo lo conoce menos. Escribimos prompts customizados para cada raza describiendo sus características físicas distintivas.

Prompt Engineering: Los Prompts Que Generan Imágenes Profesionales

Después de generar 600+ imágenes, hemos destilado los principios de prompting que producen los mejores resultados:

Principio 1: Sé específico sobre el estilo fotográfico

En lugar de: “oficina moderna”

Usa: “Interior de oficina corporativa moderna en Ciudad de México, cristales panorámicos con vista a la ciudad, escritorio minimalista blanco, planta monstera, iluminación natural suave, fotografía editorial 16:9, estilo arquitectura mexicana contemporánea”

Principio 2: Incluye contexto mexicano

Imagen 4 genera imágenes con sesgo hacia contextos estadounidenses/europeos por default. Para que las imágenes se vean mexicanas:

Menciona “Ciudad de México” o “México” explícitamente
Incluye elementos culturales (colores mexicanos, arquitectura, vegetación)
Especifica tonos de piel cuando generas personas
Referencia calles, edificios o ambientes reconociblemente mexicanos

Principio 3: Especifica composición y aspect ratio

Siempre incluimos en el prompt:

“16:9” para hero images y featured posts
“centered composition” o “rule of thirds” para composición predecible
“negative space on left/right” cuando necesitamos espacio para texto overlay
“professional photography, high quality, sharp focus” como calificadores de calidad

Principio 4: Batch con variaciones

Para mantener consistencia visual en un batch de imágenes (como las 50 de GlamBook), creamos un “prompt base” con los elementos constantes y solo variamos el sujeto:

// Prompt base GlamBook
const BASE_PROMPT = `Elegant beauty salon interior, warm ambient lighting,
ivory and gold color palette, modern luxury aesthetic,
professional photography, 16:9 aspect ratio`;

// Variaciones
const SERVICES = [
  `${BASE_PROMPT}, professional hairstylist cutting woman's hair`,
  `${BASE_PROMPT}, manicure station with nail polish collection`,
  `${BASE_PROMPT}, facial treatment in spa room`,
];

Principio 5: Prompts por sector

Tenemos un catálogo de 55 prompts organizados por sector (salud, construcción, finanzas, tecnología, etc.) que usamos como base para las imágenes del blog. Cada sector tiene su paleta de colores, estilo visual, y elementos recurrentes.

Las Limitaciones Reales de Imagen 4 (Que Nadie Te Dice)

Limitación 1: Texto en imágenes — no funciona

Si tu prompt incluye texto que debería aparecer en la imagen (un letrero, un logo, texto en pantalla), el resultado va a ser ilegible o incorrecto. Los modelos de generación de imágenes todavía no manejan texto bien. Nuestra solución: generar la imagen sin texto y agregar texto después con CSS overlay o un editor.

Limitación 2: Menores — rechazo silencioso

Si tu prompt menciona niños o menores de edad, Imagen 4 puede rechazar la solicitud sin dar un error claro. Simplemente no genera la imagen o devuelve una imagen genérica. Esto aplica incluso para contextos completamente inocentes (“niño jugando con un perro en un parque”).

Limitación 3: Consistencia entre imágenes

No hay forma de decirle a Imagen 4 “genera una imagen igual a esta pero con diferente ángulo”. Cada generación es independiente. Para mantener consistencia visual, dependes 100% del prompt. A veces funciona perfecto, a veces obtienes estilos inconsistentes.

Limitación 4: Anatomía de manos y dedos

Mejor que hace un año, pero todavía genera manos con 6 dedos o posiciones anatómicamente imposibles en ~10% de las imágenes. Revisamos cada imagen manualmente antes de usarla.

Limitación 5: Rate limiting estricto

70 imágenes/día en free tier. Si estás generando un batch grande, necesitas dividir en sesiones de múltiples días o tener múltiples API keys.

SEO de Imágenes: Cómo Optimizamos Cada Imagen para Google

Generar la imagen es solo la mitad del trabajo. La otra mitad es optimizarla para SEO:

Filename descriptivo

Nunca usamos nombres genéricos como Gemini_Generated_1.jpeg o IMG_0234.jpeg. Cada imagen tiene un nombre descriptivo con guiones: clinica-veterinaria-moderna-cdmx.jpeg, salon-belleza-interior-lujo.jpeg.

Alt text contextual

Cada imagen tiene alt text que describe lo que se ve Y incluye la keyword relevante del post: “Interior de clínica veterinaria moderna en Ciudad de México con veterinaria atendiendo paciente canino”.

Compresión obligatoria

Regla iAmanos: máximo 1280px de ancho, calidad 72% JPEG. Esto reduce el peso de ~2 MB a ~100-200 KB sin pérdida de calidad visible. Más rápido de cargar = mejor Core Web Vitals = mejor ranking en Google.

Una imagen por post

Nunca reutilizamos la misma imagen en múltiples posts. Cada post tiene su imagen única. Google penaliza contenido duplicado, incluyendo imágenes.

Workflow Batch: Cómo Generamos 30 Imágenes en una Sesión

Nuestro proceso para generar imágenes en batch está automatizado con scripts Python:

# Pseudo-código del batch generator
import google.generativeai as genai
from PIL import Image
import io, os

genai.configure(api_key=os.environ['GOOGLE_AI_KEY'])

posts = load_posts_json('posts_day31_to_day45.json')

for post in posts:
    prompt = generate_prompt(post['title'], post['sector'])
    
    response = genai.ImageGenerationModel('imagen-4.0-generate-001').generate_images(
        prompt=prompt,
        number_of_images=1,
        aspect_ratio='16:9'
    )
    
    image = Image.open(io.BytesIO(response.images[0]._pil_image))
    
    # Compresión: max 1280px, 72% quality
    image.thumbnail((1280, 720))
    filename = f"{post['slug']}.jpeg"
    image.save(filename, 'JPEG', quality=72)
    
    # Upload a WordPress
    wp_media_id = upload_to_wordpress(filename, post['alt_text'])
    set_featured_image(post['wp_id'], wp_media_id)
    
    print(f"✓ {post['title']} → Media ID: {wp_media_id}")
    time.sleep(2)  # Rate limiting

30 imágenes generadas, comprimidas, subidas a WordPress y asignadas como featured images en ~45 minutos. Todo automatizado excepto la revisión visual final (revisamos cada imagen en WordPress antes de publicar).

Alternativas a Imagen 4: Cuándo Usar Otra Herramienta

DALL-E 3 (OpenAI): Mejor para ilustraciones estilizadas y conceptuales. Peor para fotorrealismo. Más caro ($0.04-0.08 por imagen).
Midjourney: El mejor para arte visual y composiciones creativas. No tiene API programática fácil de integrar.
Stable Diffusion (local): Control total, pero requiere GPU local y mucho tuning. Ideal si necesitas generar miles de imágenes sin límites.
Imagen 4 (Google): Nuestro preferido por: API limpia, 70 imágenes/día gratis, excelente fotorrealismo, integración directa con SDK de Google.

Para el 95% de los casos de uso en producción web (featured images, assets de UI, mockups), Imagen 4 es la mejor relación calidad-precio. Es lo que usamos en todas las apps que construimos en iAmanos.

Comparativa de Costos: IA vs Diseñador vs Stock Photos

Para que dimensiones el ahorro real, aquí está la comparativa de costos para generar los assets visuales de una app típica (30-50 imágenes):

Opción 1: Diseñador gráfico freelance en México

Costo por imagen custom: $500-2,000 MXN ($25-100 USD)
40 imágenes: $20,000-80,000 MXN ($1,000-4,000 USD)
Tiempo de entrega: 2-4 semanas
Revisiones: 2-3 rondas incluidas, más costo adicional
Calidad: alta, personalizada, con dirección artística humana

Opción 2: Fotos de stock (Shutterstock, Adobe Stock)

Suscripción mensual: $30-80 USD (10-50 descargas)
40 imágenes: ~$50-100 USD en suscripción
Tiempo: inmediato (pero buscar la foto correcta toma horas)
Problema: imágenes genéricas que tu competencia también usa
Problema México: pocas fotos con contexto mexicano real

Opción 3: Google Imagen 4 (nuestro modelo)

Costo: $0 (free tier, 70/día)
40 imágenes: $0
Tiempo: 2-3 horas incluyendo prompt engineering y compresión
Calidad: fotorrealista, custom, con contexto mexicano si lo pides
Limitación: necesitas saber hacer prompts y revisar resultados

La diferencia económica es abismal. Y la calidad de Imagen 4 en 2026 ya rivaliza con fotografía de stock profesional para la mayoría de los casos de uso en apps web.

7 Errores Comunes al Usar IA Para Generar Imágenes de Apps

1. No especificar aspect ratio

Si no dices 16:9, Imagen 4 genera cuadrado (1:1) por default. Las featured images de blog necesitan 16:9 para verse bien en cards. Los avatares necesitan 1:1. Las stories de redes sociales necesitan 9:16. Siempre especifica.

2. Prompts en inglés cuando necesitas contexto mexicano

Un prompt en inglés genera resultados con sesgo norteamericano. Aunque Imagen 4 entiende mejor los prompts en inglés, agrega siempre el contexto geográfico: “Mexican office”, “Ciudad de México skyline”, “Latin American professional”.

3. No comprimir antes de subir

Las imágenes generadas vienen en alta resolución (~2 MB). Si las subes directamente a tu app, destruyes los Core Web Vitals. Siempre comprime: max 1280px, 72% JPEG. De 2 MB a 150 KB sin pérdida visual.

4. Usar nombres de archivo genéricos

Google indexa los nombres de archivo de imágenes. output_1.jpeg no aporta nada al SEO. clinica-veterinaria-moderna-cdmx.jpeg posiciona en Google Images.

5. Omitir el alt text

Cada imagen necesita alt text descriptivo para accesibilidad y SEO. No un alt text genérico (“imagen”) sino uno que describa lo que se ve y contenga la keyword relevante.

6. Reutilizar imágenes entre posts o apps

Google penaliza contenido duplicado incluyendo imágenes. Cada post debe tener su imagen única. Con 70 imágenes gratis al día, no hay excusa para reutilizar.

7. No revisar manos y dedos

Imagen 4 ha mejorado pero todavía genera manos con anatomía incorrecta en ~10% de las imágenes. Siempre revisa visualmente antes de publicar. Una mano con 6 dedos destruye la credibilidad de tu app.

El Futuro de la Generación de Imágenes con IA para Apps

Lo que viene en los próximos 12 meses:

Edición de imágenes existentes: Imagen 4 ya soporta inpainting (editar partes de una imagen). Pronto podrás decir “cambia el color de la pared a azul” o “agrega un logo en la recepción”.
Consistencia de personajes: Generar el mismo personaje en múltiples poses y contextos. Crítico para crear staff de demo coherente.
Texto legible en imágenes: El punto débil actual. Cuando los modelos generen texto nítido, podrás crear banners, infográficas y UI mockups completos sin Canva.
Video corto: Google Veo y otros modelos ya generan video de 5-10 segundos. Para demos de apps y contenido de redes sociales, el video generado por IA reemplazará las capturas de pantalla estáticas.

En iAmanos ya estamos integrando estas capacidades conforme se vuelven disponibles. Cada app nueva tiene mejores assets visuales que la anterior porque la tecnología evoluciona semanalmente.

Integración Completa: De la Generación al Deploy en WordPress

Nuestro workflow de imágenes no termina con la generación. Aquí está el pipeline completo que usamos para los 267 featured images del blog:

Pipeline end-to-end

Lectura del JSON de posts: Script Python carga el archivo JSON con títulos, slugs, y sectores de cada post
Generación de prompt: Basado en el sector del post, selecciona el prompt base del catálogo de 55 prompts por sector y lo personaliza con el título específico
Llamada a Imagen 4 API: ai.models.generateImages() con modelo imagen-4.0-generate-001, aspect ratio 16:9
Recepción de imagen: La API devuelve la imagen en base64. La decodificamos y guardamos como archivo temporal
Compresión con Pillow: Resize a max 1280px de ancho, calidad 72% JPEG. El archivo baja de ~2 MB a ~150 KB
Rename con slug: El archivo se renombra al slug del post: inteligencia-artificial-sector-salud.jpeg
Upload a WordPress: POST a /wp-json/wp/v2/media con el archivo y metadata (title, alt_text, caption)
Asignación como featured: POST a /wp-json/wp/v2/posts/{id} con featured_media: media_id
Registro en JSON de resultados: Guardamos media_id, filename, y URL para control de inventario
Rate limit: 2 segundos de espera entre cada generación para respetar límites de la API

Este pipeline está 100% automatizado. Lo ejecutamos, nos vamos a tomar un café, y cuando volvemos tenemos 30 imágenes generadas, comprimidas, subidas y asignadas. El único paso manual es la revisión visual final — verificar que no haya manos defectuosas, composiciones raras, o textos ilegibles.

Organización de archivos

Mantenemos un directorio organizado por batch:

images/
├── days1-15/
│   ├── days1_3_results.json
│   └── [30 archivos .jpeg]
├── days16-30/
│   ├── days16_18_results.json
│   └── [30 archivos .jpeg]
├── days31-45/
│   ├── days31_33_results.json
│   └── [30 archivos .jpeg]
└── pillar-pages/
    └── [10 archivos .jpeg]

Cada JSON de resultados contiene el mapeo completo: slug → filename → WP media ID → WP post ID. Esto permite auditar en cualquier momento qué imagen tiene cada post y regenerar si es necesario.

Si necesitas una app con imágenes profesionales generadas por IA, cotiza tu proyecto aquí.

Preguntas Frecuentes

¿Google Imagen 4 es realmente gratis?

Sí, dentro del free tier de Google AI Studio puedes generar hasta 70 imágenes por día sin costo. Para volúmenes mayores necesitas habilitar billing, pero el costo por imagen es mínimo (fracciones de centavo).

¿Las imágenes generadas con IA tienen problemas de copyright?

Las imágenes generadas con Imagen 4 son tuyas para uso comercial según los términos de Google AI. No infringen copyright de terceros porque son creaciones originales del modelo. Sin embargo, evita generar imágenes de personas reales o marcas registradas.

¿Se puede usar Imagen 4 para generar logos?

No recomendado. Los logos requieren precisión vectorial y texto legible — dos cosas que los generadores de imágenes no manejan bien. Para logos, mejor usar herramientas vectoriales o un diseñador humano.

¿Cuál es la mejor resolución para imágenes web generadas con IA?

Para featured images y heroes: 1280×720 (16:9) a 72% calidad JPEG. Esto produce archivos de 100-200 KB que cargan rápido. No necesitas más resolución para web — las pantallas muestran como máximo 1920px de ancho y la diferencia visual es imperceptible.

¿Imagen 4 genera personas de aspecto mexicano?

Sí, si lo especificas en el prompt. Incluye referencias como “Mexican professional”, “Ciudad de México context”, o describe tonos de piel específicos. Sin estas indicaciones, el modelo tiende a generar personas con apariencia caucásica por sesgo del training data.