$19.28 Por 206 Fichas Veterinarias: La Fábrica de Contenido Especializado

Cuando decidimos que WouWou necesitaba fichas completas para 206 razas de perro, hicimos los números del enfoque tradicional: contratar un veterinario redactor a $500 MXN por ficha × 206 = $103,000 MXN ($6,000 USD). Tiempo estimado: 2-3 meses. Y probablemente tendríamos inconsistencias de estilo entre las primeras y las últimas fichas.

En IAmanos elegimos otra ruta: generación masiva con Claude Sonnet 4.6 usando prompt caching, validación con Zod, validación semántica, y un pipeline de batch processing con 5 requests concurrentes.

Resultado: 206 fichas completas en 3 días por $19.28 USD. Cada ficha con 9 secciones (identidad, temperamento, cuidados, nutrición, alertas de salud, dos/don’ts, compatibilidad, cultura/mitología, metadata SEO). Calidad validada por schema Zod + verificación semántica automática. Sistema de badges MVZ para revisión profesional.

Este artículo documenta cada decisión técnica del pipeline. Si necesitas generar contenido especializado masivo — para cualquier industria, no solo veterinaria — este es el blueprint.

Anatomía de una Ficha de Raza: 9 Secciones, 2,000+ Palabras Cada Una

Cada ficha de raza no es un párrafo genérico de Wikipedia. Es un perfil completo diseñado para ser útil tanto para el veterinario como para el dueño de mascota.

Las 9 secciones de cada ficha

1. Identidad: Nombre oficial, nombres alternativos, grupo FCI, país de origen, tamaño (peso y altura por género), expectativa de vida, tipo de pelaje, colores comunes, rango de precio en México.

2. Temperamento: Nivel de energía (1-5), afectuosidad, protección, socialización con otros perros, socialización con niños, ladridos, independencia. Descripción narrativa del carácter típico.

3. Cuidados: Frecuencia de baño, cepillado, corte de uñas, limpieza de oídos, ejercicio diario necesario, tolerancia al calor/frío, necesidades especiales de grooming por tipo de pelaje.

4. Nutrición: Calorías diarias recomendadas por peso, frecuencia de alimentación (cachorro vs adulto vs senior), alimentos beneficiosos, alimentos prohibidos, tendencia a sobrepeso, suplementos recomendados.

5. Alertas de salud: Enfermedades genéticas comunes, signos de alerta, frecuencia de chequeos recomendada, vacunas especiales, problemas dentales comunes. Con disclaimer de “consulte a su MVZ”.

6. Dos & Don’ts: Lista de 8-10 cosas que SÍ hacer y 8-10 que NO hacer con esa raza. Específicos — no genéricos. Por ejemplo, para un Husky: “SÍ: ejercicio intenso diario, cepillado 3x/semana durante muda”. “NO: dejarlo solo en balcón caluroso, raparlo en verano (el doble pelaje lo protege del sol)”.

7. Compatibilidad: Ideal para: departamento/casa/rancho, familia con niños/pareja/persona sola, dueño sedentario/activo/deportista. Puntaje de adaptabilidad para diferentes escenarios de vida.

8. Cultura y mitología: Historia de la raza, apariciones en cine/TV/literatura, datos curiosos, récords, famosos que tienen esa raza. Esta sección agrega personalidad y hace la ficha memorable.

9. Metadata SEO: Title tag, meta description, focus keyword, alt text para imagen, slug URL. Esto permite que cada ficha sea una landing page SEO-optimizada.

El Prompt que Genera Fichas de Calidad Veterinaria

El prompt no es un párrafo simple de “escribe sobre el Golden Retriever”. Es un sistema de instrucciones estructurado en 4 capas.

Capa 1: System prompt (cacheado)

El system prompt define el rol, formato JSON esperado, schema de cada sección, reglas de calidad, y restricciones médicas. Este prompt es IDÉNTICO para las 206 razas — por eso se cachea con la API de Anthropic. El cache hit rate fue superior al 95%, lo que redujo el costo dramáticamente.

Reglas clave del system prompt:

  • No inventar datos médicos — si no hay información verificable, indicar “consultar con MVZ”
  • Rangos de peso y altura deben ser biológicamente plausibles
  • Expectativa de vida debe corresponder al tamaño de la raza (perros grandes viven menos que pequeños)
  • Precios en MXN deben reflejar el mercado mexicano real (no copiar precios de EUA)
  • Respuestas SIEMPRE en español de México (no “vale”, no “tío”, no “coche” para auto)

Capa 2: Few-shot examples (cacheado)

3 fichas completas de ejemplo: una raza grande (Pastor Alemán), una mediana (Beagle), y una pequeña (Chihuahua). Estas fichas fueron escritas manualmente como gold standard y sirven como referencia de calidad y formato. También cacheadas.

Capa 3: Variable por raza (no cacheada)

El único contenido que cambia entre requests: el nombre de la raza y datos básicos conocidos (grupo FCI, origen). Esto es mínimo en tokens, lo que mantiene el costo bajo.

Capa 4: Output format (cacheado)

El schema JSON exacto esperado, con tipos de datos, rangos válidos, y campos obligatorios. Esto permite validación automática con Zod después de la generación.

El impacto del prompt caching en costo

ConceptoSin cacheCon cacheAhorro
Tokens de input por request~8,000~1,500 (solo capa 3 no cacheada)81%
Costo input por request~$0.024~$0.004581%
Costo total 206 razas (input)~$4.94~$0.9381%
Costo output (no se cachea)~$18.35~$18.350%
Costo total~$23.29~$19.2817%

El ahorro de 17% parece modesto en porcentaje, pero en un pipeline de 206 requests, cada centavo cuenta. Y si escalaras a 1,000+ fichas (para gatos, aves, reptiles), el ahorro se amplifica.

Doble Validación: Zod Schema + Validación Semántica

Generar contenido con IA es la parte fácil. Asegurar que el contenido sea CORRECTO es donde la mayoría falla. Implementamos doble validación.

Validación con Zod: Estructura y tipos

Cada ficha generada pasa por un schema Zod que verifica:

  • Campos obligatorios presentes: ¿Tiene las 9 secciones? ¿Cada sección tiene todos los campos requeridos?
  • Tipos correctos: ¿El peso es un número, no un string? ¿La expectativa de vida es un rango [min, max], no un valor único?
  • Rangos válidos: ¿El peso está entre 0.5 y 100 kg? ¿La expectativa de vida entre 5 y 20 años? ¿El nivel de energía entre 1 y 5?
  • Formato correcto: ¿El slug es lowercase sin acentos? ¿El title tag tiene <60 caracteres? ¿La meta description tiene entre 140-160 caracteres?
  • Arrays no vacíos: ¿Hay al menos 3 enfermedades genéticas? ¿Al menos 5 dos y 5 don’ts? ¿Al menos 3 datos culturales?

Si la validación Zod falla, la ficha se marca para re-generación. El pipeline re-intenta hasta 3 veces con el mismo prompt. Si falla 3 veces, se marca para revisión manual.

Validación semántica: ¿Tiene sentido biológico?

La validación Zod verifica estructura pero no significado. La validación semántica verifica que los datos tengan sentido:

  • Peso vs tamaño: Si la raza es clasificada como “pequeña” pero el peso dice 40 kg, hay un error. Un Chihuahua no pesa 40 kg.
  • Expectativa de vida vs tamaño: Las razas grandes (>30 kg) típicamente viven 8-12 años. Si Claude dice que un Gran Danés vive 18 años, es incorrecto.
  • Calorías vs peso: Las calorías diarias deben ser proporcionales al peso. Un perro de 5 kg no necesita 3,000 calorías.
  • Precios en México: Un Chihuahua no cuesta $100,000 MXN. Un Basenji sí puede costar $80,000 MXN (es raro en México). La validación tiene rangos por raza basados en datos de mercado.
  • Consistencia interna: Si dice “pelo corto” en identidad pero recomienda “cepillado diario” en cuidados, hay inconsistencia. Un pelo corto no necesita cepillado diario.

Los errores semánticos se flaggean con nivel de severidad: WARNING (dato plausible pero inusual) vs ERROR (dato claramente incorrecto). Los ERROR se re-generan, los WARNING se marcan para revisión MVZ.

Pipeline de Batch Processing: 5 Concurrentes con Checkpointing

Generar 206 fichas secuencialmente (una a la vez) tomaría ~34 horas (10 minutos por ficha). Con batch processing de 5 concurrentes, lo redujimos a ~7 horas. Con el checkpointing, podemos pausar y resumir sin perder progreso.

Arquitectura del pipeline

  1. Queue de razas: Las 206 razas en un array ordenado por grupo FCI. Cada una tiene un estado: PENDING, IN_PROGRESS, COMPLETED, FAILED, RETRYING.
  2. Worker pool: 5 workers concurrentes que toman razas del queue. Cada worker genera la ficha, valida con Zod, valida semánticamente, y persiste en la base de datos.
  3. Rate limiter: Max 30 requests por minuto a la API de Anthropic. Los workers esperan si se acercan al límite.
  4. Checkpoint: Después de cada ficha completada, el estado del queue se persiste en un archivo JSON. Si el proceso se interrumpe (error de red, timeout, corte de luz), al reiniciar lee el checkpoint y continúa donde se quedó.
  5. Retry logic: Si una ficha falla (error de API, validación fallida), se re-intenta hasta 3 veces con backoff exponencial (1s, 4s, 16s). Después de 3 fallos, se marca como FAILED para revisión manual.

Resultados del pipeline

MétricaValor
Fichas generadas exitosamente al primer intento191/206 (92.7%)
Fichas que requirieron retry12/206 (5.8%)
Fichas que fallaron 3 veces (revisión manual)3/206 (1.5%)
Warnings semánticos47 en total (promedio 0.23 por ficha)
Errores semánticos8 en total (corregidos por retry)
Tiempo total de procesamiento~7 horas (distribuido en 3 días)
Costo total API$19.28 USD

Las 3 fichas que fallaron

Curiosamente, las razas que más problemas dieron fueron las más raras: Azawakh (raza del Sahel africano con poca información en español), Mudi (raza húngara casi desconocida en México), y Cimarrón Uruguayo (información contradictoria sobre estándares de raza). Estas 3 se completaron manualmente con investigación adicional.

Optimizaciones de performance del pipeline

Durante el desarrollo del pipeline, identificamos varios cuellos de botella que optimizamos:

Throttling inteligente: En lugar de enviar 5 requests simultáneos constantemente, implementamos un sistema adaptativo. Si la API de Anthropic responde en menos de 10 segundos, mantenemos 5 workers. Si empieza a responder más lento (señal de rate limiting), reducimos a 3 workers automáticamente. Si los tiempos de respuesta se normalizan, volvemos a 5. Esto evita errores 429 (rate limit exceeded) sin sacrificar velocidad innecesariamente.

Persistencia incremental: Cada ficha se guarda en la base de datos inmediatamente después de pasar validación, no al final del batch. Si el proceso falla en la ficha #150, las 149 anteriores ya están persistidas. El checkpoint JSON se usa para saber cuáles faltan, pero los datos ya están en PostgreSQL.

Deduplicación de contenido: Un check post-generación verifica que dos fichas no tengan párrafos idénticos o demasiado similares. Claude Sonnet a veces reutiliza frases entre razas del mismo grupo (todos los terriers reciben consejos de cuidado muy similares). El check de deduplicación flaggea similaridad superior al 30% en cualquier sección para revisión.

Logging detallado: Cada request se loggea con: timestamp, raza, tokens de input/output, costo, tiempo de respuesta, resultado de validación Zod, resultado de validación semántica. Este log permite auditar exactamente qué pasó con cada ficha y calcular costos con precisión.

El Sistema de Badges MVZ: Confianza en Contenido Generado por IA

Generar 206 fichas con IA es poderoso pero levanta una pregunta legítima: ¿cómo saben los usuarios que la información es confiable?

El sistema de 3 badges

Badge “Generado por IA”: Toda ficha recién generada tiene este badge. Indica que el contenido fue creado por Claude Sonnet y validado automáticamente (Zod + semántico). Es content de calidad pero no ha sido revisado por un profesional veterinario.

Badge “Revisado por MVZ”: Un Médico Veterinario Zootecnista revisó la ficha y confirmó que la información médica es correcta. No editó el contenido — solo verificó que no hay errores clínicos.

Badge “Verificado por MVZ”: Un MVZ no solo revisó sino que enriqueció la ficha con información adicional, corrigió detalles específicos, y aprobó la ficha como referencia clínica confiable.

El flujo de revisión MVZ

El skill /wouwou-mvz-review permite listar razas pendientes de revisión, aprobar/rechazar/solicitar cambios, y trackear el progreso. El modelo BreedReview en Prisma guarda: quién revisó, cuándo, qué comentarios hizo, y qué nivel de badge asignó.

¿Por qué no revisarlo todo antes de publicar?

Porque 206 razas × 30 minutos de revisión MVZ = 103 horas de trabajo profesional a ~$500/hora = $51,500. Más caro que generar las fichas originalmente. En su lugar, publicamos con badge “Generado por IA” y priorizamos la revisión MVZ por popularidad de raza. Las 30 razas más buscadas se revisan primero. Las razas exóticas con 10 visitas/mes pueden esperar.

Esto es transparencia con el usuario: sabes exactamente qué nivel de revisión tiene cada ficha. No pretendemos que la IA es un veterinario. Decimos explícitamente que es contenido generado por IA y recomendamos consultar con un profesional para decisiones médicas.

Cómo Aplicar Este Pipeline a Cualquier Industria

El pipeline de WouWou no es exclusivo de veterinarias. Es un framework de generación de contenido especializado masivo que aplica a cualquier industria con un catálogo grande.

Ejemplos de aplicación

Restaurantes: 200 fichas de platillos con: ingredientes, alérgenos, calorías, maridaje, historia del platillo, técnica de preparación, foto sugerida. Costo estimado: ~$20 USD.

Inmobiliaria: 500 fichas de colonias/fraccionamientos con: ubicación, precios promedio, amenidades, escuelas cercanas, transporte, seguridad, perfil de habitante ideal. Costo estimado: ~$50 USD.

Automotriz: 150 fichas de modelos de auto con: especificaciones, rendimiento, costos de mantenimiento, seguros promedio, opiniones de dueños, comparativas. Costo estimado: ~$15 USD.

Educación: 300 fichas de carreras universitarias con: perfil de ingreso, plan de estudios, campo laboral, salarios promedio en México, mejores universidades, becas disponibles. Costo estimado: ~$30 USD.

El framework en 6 pasos

  1. Define el schema: ¿Qué secciones tiene cada ficha? ¿Qué campos? ¿Qué tipos de datos? Crea el Zod schema primero.
  2. Escribe 3 fichas gold standard: Manualmente, con la máxima calidad. Estas son tus few-shot examples.
  3. Diseña el system prompt: Rol, reglas de calidad, restricciones, formato de salida. Optimiza para prompt caching.
  4. Implementa validación semántica: Reglas específicas de la industria que verifican que los datos tengan sentido.
  5. Ejecuta el batch: 5 concurrentes, rate limiting, checkpointing, retry logic.
  6. Revisión humana priorizada: Las fichas más importantes primero, las edge cases después.

Todo esto lo hacemos en IAmanos como servicio de automatización con IA. Si tu negocio tiene un catálogo de 100+ items que necesitan fichas de calidad, el pipeline está probado y listo.

Costos Detallados: Cada Centavo Documentado

ConceptoCostoDetalle
API Anthropic (206 requests con cache)$19.28 USDInput: $0.93 (cached) + Output: $18.35
Google Imagen 4 (206 imágenes)~$8.24 USD$0.04 por imagen
Desarrollo del pipeline~16 horasPrompt engineering, Zod schemas, validación semántica, batch script
Revisión manual (3 fichas fallidas)~2 horasInvestigación + redacción de razas raras
Revisión MVZ (top 30 razas)~15 horas × $500/hr$7,500 MXN (costo profesional externo)
Total sin MVZ~$27.52 USD + tiempo dev
Total con MVZ top 30~$27.52 + $440 USD

Comparado con el enfoque manual ($6,000 USD para un redactor veterinario × 206 fichas), el ahorro es del 99.5%. Y el resultado es más consistente — las 206 fichas tienen exactamente el mismo formato, nivel de detalle, y estilo. Un redactor humano inevitablemente varía entre la ficha #1 y la #206.

La Generación Masiva de Contenido con IA No Es el Futuro — Es el Presente

206 fichas de razas por $19.28 no es un truco ni una demo — es un pipeline de producción que alimenta un SaaS real con clientes reales. Las fichas son el core content de WouWou, y son lo que diferencia a WouWou de cualquier “sistema veterinario” genérico.

La clave no es la IA per se — es el pipeline: prompt caching para reducir costo, Zod para validar estructura, semántica para validar significado, batch processing para velocidad, checkpointing para resiliencia, y badges MVZ para confianza.

Cualquier industria con un catálogo de 100+ items puede beneficiarse de este enfoque. Restaurantes, inmobiliarias, automotrices, escuelas, hospitales — si tienes datos que organizar y contenido que generar, el pipeline existe y cuesta centavos.

Si quieres aplicar esta automatización a tu catálogo, es exactamente lo que hacemos en la fábrica de apps de IAmanos.

¿Necesitas contenido masivo con IA? Cotiza tu pipeline →

Preguntas Frecuentes

¿Cuánto cuesta generar contenido masivo con Claude Sonnet?

206 fichas completas por $19.28 USD con prompt caching. Costo promedio: $0.094 por ficha. Para catálogos de 100-500 items, estima $10-$50 USD.

¿Cómo asegurar la calidad del contenido IA?

Doble validación: Zod para estructura y tipos, validación semántica para significado. Re-generación automática de fichas que fallan. 92.7% éxito al primer intento.

¿Qué es el prompt caching de Anthropic?

Cachea las partes del prompt que no cambian entre requests. Redujo el costo de input en 81% para las 206 fichas.

¿Se puede aplicar a otras industrias?

Sí. Restaurantes, inmobiliarias, automotriz, educación — cualquier industria con catálogo de 100+ items. El framework es el mismo.

¿El contenido IA es confiable para info médica?

Confiable para info general. Requiere revisión profesional para info médica específica. WouWou usa badges de confianza transparentes.