Gratis Hosting
+ Dominio .com
+ Correos Corporativos
+ Certificado SSL
+ Primer año de servicios 100% Gratis.
+Promoción valida para clientes de Diseño Web, Tiendas Virtuales y Landing Pages.

Responsable: Otorongo Negro E.I.R.L. (KOM) | RUC 20604716595 | Derechos ARCOP: legal@kom.pe · Política de Privacidad

Cómo la IA lee tus imágenes: alt, captions, EXIF y contexto

Señales que lee la inteligencia artificial en imágenes: texto alt, captions, EXIF y contexto visual

La IA lee tus imágenes por dos vías: los modelos multimodales ven el contenido visual directamente, y todos los sistemas leen las señales de texto que la acompañan, alt, nombre de archivo, caption y el texto alrededor. La consecuencia práctica: una buena imagen mal descrita es invisible a medias, y un alt bien escrito trabaja para accesibilidad, SEO clásico y respuestas de IA al mismo tiempo. Aquí va cada señal, su peso real y la prueba para verificarlo tú mismo.

¿Cómo procesa una IA las imágenes de tu web?

Conviven dos mecanismos. El primero es la visión multimodal: los modelos actuales pueden mirar la imagen y describir qué contiene, con una precisión que mejora cada año. El segundo es el de siempre: las señales textuales asociadas, que los sistemas usan para indexar, recuperar y decidir qué imagen acompaña qué respuesta. En la práctica ambos se combinan, y el texto sigue mandando más de lo que el marketing de la multimodalidad sugiere, porque es más barato de procesar y menos ambiguo.

Para tu estrategia esto significa que las imágenes no son decoración: son contenido con señales propias, parte del mismo sistema de legibilidad que trabajamos en la guía de GEO para aparecer en ChatGPT, Gemini, Claude y Perplexity y en el servicio de posicionamiento GEO. Una ficha de producto con fotos bien descritas es más citable que la misma ficha con IMG_4032.jpg repetido seis veces.

El alt que describe bien: reglas y ejemplos

El alt nació para accesibilidad y esa sigue siendo su prueba de calidad: si un lector de pantalla lo lee en voz alta, ¿la persona entiende qué hay en la imagen? Esa misma descripción es la que mejor sirve a los sistemas. Tres reglas lo resuelven casi todo. Describe lo que se ve, con sustantivos concretos y contexto: no logo sino logotipo de la cafetería Aroma en fondo crema. Incluye el dato diferencial si existe: modelo, color, material, ubicación. Y mantén la extensión razonable, una a dos frases; el alt no es un párrafo.

Compara: alt=zapatilla contra alt=zapatilla urbana de cuero negro talla 42, vista lateral. El segundo responde preguntas que un comprador hace y le da al sistema material para emparejar la imagen con consultas reales. La keyword entra cuando describe de verdad la imagen; metida a la fuerza, ensucia la señal y la accesibilidad a la vez.

Nombres de archivo, captions y el texto alrededor

El alt no trabaja solo. La jerarquía práctica de las demás señales:

Señal Peso práctico Qué hacer
Texto alrededor Alto La imagen va junto al párrafo que habla de lo que muestra, no tres secciones después
Alt Alto Descripción concreta de una a dos frases
Nombre de archivo Medio Descriptivo con guiones: tienda-woocommerce-panel-pedidos.webp
Caption visible Medio Úsala cuando aporta contexto que el cuerpo no da
Title de la imagen Bajo No le dediques esfuerzo; el alt manda

El error de flujo más común es subir IMG_4032.jpg y planear renombrarla después: después no existe. Renombra antes de subir, porque WordPress fija la URL del archivo en ese momento, y esa URL también es señal.

¿El EXIF importa de verdad?

Menos de lo que se vende. El EXIF son los metadatos que la cámara graba en el archivo: equipo, fecha, parámetros y, en celulares, coordenadas GPS. La realidad operativa: muchas plataformas y CDNs eliminan o reducen estos metadatos al optimizar, y no hay evidencia sólida de que los sistemas principales los usen como señal de posicionamiento. Conclusión honesta: no construyas estrategia sobre EXIF.

Donde sí importa es en privacidad, y en sentido inverso: las fotos tomadas con celular pueden llevar las coordenadas de tu casa o tu almacén incrustadas. Revisa y limpia el EXIF de ubicación antes de subir fotos propias, sobre todo si trabajas desde casa. El metadato que deberías cuidar no es para las máquinas: es el que no quieres regalar.

¿Qué revela la prueba de subir tus imágenes a un asistente?

Esta prueba toma diez minutos y es la versión multimodal de la prueba de la sección suelta. Toma tus cinco imágenes más importantes, fotos de producto, del local, del equipo, y súbelas una por una a un asistente multimodal con dos preguntas: qué ves en esta imagen, y qué negocio o producto crees que representa. Sin contexto, sin pistas.

Las respuestas te dicen exactamente qué comunica cada imagen por sí misma. Si el modelo ve una oficina genérica donde tú ves tu identidad de marca, esa foto depende al cien por ciento de sus señales de texto. Si describe tu producto con precisión, tienes una imagen que trabaja sola. Con ese diagnóstico decides: mejorar la foto, mejorar el alt, o ambos. En KOM corremos esta prueba con las imágenes clave de cada proyecto y los resultados sorprenden siempre, en ambas direcciones.

Qué aumenta la probabilidad de aparecer en respuestas con imágenes

Los sistemas que muestran imágenes en sus respuestas las sacan de páginas que pudieron rastrear y entender. Las palancas que controlas: imágenes indexables, sin bloqueos de robots ni lazy loading que las esconda del rastreador; cercanía semántica, cada imagen junto al texto que la explica; originalidad, porque la foto propia de tu producto compite mejor que el stock que aparece en doscientos sitios; y datos estructurados donde corresponda, como las imágenes dentro del schema Product de una ficha.

La originalidad merece énfasis para el mercado peruano: rubros enteros usan las mismas tres fotos de banco de imágenes. Una sesión de fotos propia, aunque sea con celular y buena luz, te separa del empate técnico en el que vive tu competencia.

Cómo organizar el trabajo en un sitio con cientos de imágenes

El catálogo viejo asusta, pero el orden de ataque lo vuelve manejable. Primera ola: las imágenes de tus páginas de dinero, fichas top y páginas de servicio, que son las que aparecen en decisiones de compra. Segunda ola: las de tus diez contenidos con más tráfico. El resto se corrige hacia adelante, con una regla de proceso: ninguna imagen nueva se sube sin nombre descriptivo y alt escrito, lo que frena la acumulación de deuda.

Para el volumen heredado, las herramientas de generación asistida de alt aceleran, con una condición: revisión humana antes de guardar, porque la descripción automática se equivoca justo en lo que te diferencia, modelos, materiales, contexto local. El criterio editorial sigue siendo tuyo; la herramienta solo escribe el borrador.

Errores comunes con imágenes e IA

Los cinco que más corregimos. Alt vacíos o repetidos en plantilla, con la misma frase en cuarenta imágenes. Nombres de archivo de cámara en todo el catálogo. Infografías con el dato importante solo en píxeles: si el número clave vive únicamente dentro de la imagen, acompáñalo en texto, porque la extracción visual todavía falla con cifras y tildes. Imágenes decorativas con alt forzado, cuando lo correcto es alt vacío para que los lectores de pantalla las salten. Y el peso desbocado: fotos de 4 MB que arrastran la velocidad de la página, que sí es señal para todo.

Preguntas frecuentes

¿El alt debe llevar mi keyword principal?

Solo si describe honestamente la imagen. Si vendes tortas en Lima y la foto muestra una torta de chocolate de tu vitrina, torta de chocolate artesanal en Lima es descripción y keyword a la vez: perfecto. Si la imagen es tu equipo trabajando, forzar la keyword ahí degrada accesibilidad y señal. La regla: primero verdad visual, después coincidencia con búsquedas.

¿Usar fotos de stock perjudica mi visibilidad?

No te penaliza, pero tampoco te diferencia: la misma imagen en cientos de sitios no le da a ningún sistema una razón para asociarla contigo. Para páginas de relleno el stock es aceptable; para producto, local y equipo, la foto propia gana siempre. Si usas stock, al menos descríbelo con alt específico de tu contexto.

¿El formato WebP o AVIF cambia cómo me lee la IA?

Para la comprensión visual y las señales de texto, no: los sistemas procesan los formatos modernos sin problema. Donde sí impactan es en peso y velocidad de carga, que afectan rastreo y experiencia. Usa el formato moderno que tu stack soporte bien, cuida la compresión y no le pidas al formato lo que debe hacer la descripción.

¿Debo borrar todo el EXIF de mis fotos antes de subirlas?

Borra siempre la geolocalización de fotos tomadas con celular, salvo que la ubicación sea pública y deliberada, como el local de un restaurante. El resto del EXIF, cámara y parámetros, es inofensivo: elimínalo si tu flujo de optimización lo hace por defecto, consérvalo si te sirve de archivo. La decisión es de privacidad y peso, no de posicionamiento.

Tu siguiente paso: corre hoy la prueba multimodal con tus cinco imágenes clave y anota qué vio el asistente en cada una. Después revisa sus alt con esa evidencia delante. En una hora habrás alineado lo que tus imágenes muestran con lo que dicen, que es todo lo que esta disciplina pide.

Picture of Christian Otero
Christian Otero
Founder & CEO @ KOM Agencia Digital | Pionero en Generative Engine Optimization (GEO) y SEO Técnico Internacional | +24 Años escalando operaciones digitales | Ex-Nextel, Entel, Prosegur | Ingeniero de Sistemas con Postgrado en Marketing Digital y Comercio Exterior.
Artículos relacionados
¿Buscas diseñar tu página web?

Escríbenos:

Responsable: Otorongo Negro E.I.R.L. (KOM) | RUC 20604716595 | Derechos ARCOP: legal@kom.pe · Política de Privacidad

¿Preguntas?
¡Te asesoramos gratis!

Responsable: Otorongo Negro E.I.R.L. (KOM) | RUC 20604716595 | Derechos ARCOP: legal@kom.pe · Política de Privacidad

Si prefieres llámanos o escríbenos...

Estamos atentos a tu comunicación para poder implementar tus nuevas herramientas digitales.

EMPRESA REGISTRADA Ante SUNAT e INDECOPI PAGO 100% SEGURO A través de KOM Pay TRANSPARENCIA TOTAL Precios 100% Públicos POTENCIADOS CON IA Usamos Inteligencia Artificial