Los logs del servidor cuentan lo que Search Console resume: el registro crudo de cada petición que tu sitio recibe, cada visita de cada bot con su URL, su código de respuesta y su momento exacto, la verdad completa del rastreo que los paneles agregan y filtran, y leerlos revela los patrones que ningún informe muestra, el crawl waste, el presupuesto de rastreo quemado en URLs basura, los errores servidos solo a los bots, las zonas del sitio que los rastreadores ignoran, los bots de IA que ya te visitan sin que lo sepas. Esta guía baja el análisis de logs a la práctica del hosting peruano: dónde encontrarlos en el compartido y el administrado, qué patrones buscar con ojos de SEO, y las herramientas gratuitas que convierten el archivo críptico en respuestas, porque los logs son la fuente primaria y el sitio serio los lee al menos cuando algo no cuadra.
Tabla de Contenidos
¿Qué hay en un log y por qué importa para SEO?
Cada línea del log es una petición real: la IP que pidió, el agente que se identificó, el bot de Google, el de Bing, los rastreadores de IA con sus nombres, la URL pedida, el código que el servidor respondió, el momento y el peso, la materia prima de todo lo que los paneles después cocinan, y su valor SEO es de verdad sin filtro, la consola muestra lo que Google decide contarte con días de retraso y agregación, los logs muestran todo lo que pasó, cada visita de bot a cada URL, los errores que recibió, la frecuencia real de rastreo por sección, los datos que responden las preguntas finas, por qué esta página no se indexa, la respuesta a veces está en que el bot recibe errores que el navegador no ve, el diagnóstico fino que solo los logs dan porque solo ellos lo registraron. El marco vive en la guía maestra de SEO local y el servicio en consultoría SEO: los logs como la fuente primaria del lado técnico.
Dónde encontrarlos: el compartido y el administrado
El acceso depende del hosting: el compartido típico peruano los expone en su panel, la sección de métricas o registros del cPanel con los archivos de acceso descargables, los logs sin procesar de los últimos días o semanas según la configuración, la materia disponible que casi nadie descarga, el administrado y los VPS con su acceso por panel propio o por la línea de comandos donde el plan lo dé, los archivos en sus rutas estándar, y las limitaciones conocidas se manejan, la retención corta del compartido que obliga a descargar periódicamente para el análisis histórico, el proxy de Cloudflare del stack que registra las IPs del borde, la cabecera del visitante real configurada o los logs del propio Cloudflare consultados en su panel, la capa que esta serie ya conoce afectando también aquí. La rutina mínima de captura: la descarga mensual del archivo a la carpeta del proyecto, el historial propio construido aunque el hosting borre, los logs del año disponibles cuando el diagnóstico los pida, la previsión barata que el análisis futuro agradece cuando el problema aparezca y exija historia.
Los patrones que buscar: waste, errores y ausencias
La lectura SEO busca patrones concretos: el crawl waste primero, las URLs que consumen rastreo sin merecerlo, los parámetros infinitos visitados miles de veces, las paginaciones profundas recorridas a diario, los archivos basura del duplicado de esta serie recibiendo más visitas de bot que tus páginas de dinero, la proporción que duele, el presupuesto quemado en ruido que las correcciones de robots y canónicas redirigen hacia lo valioso, los errores servidos a bots segundo, los códigos rotos filtrados por agente, las URLs que devuelven errores al rastreador, los 404 masivos, los errores de servidor intermitentes que el monitoreo no captó, los bloqueos del firewall al bot legítimo, el desastre silencioso del rastreador baneado por una regla de seguridad entusiasta, y las ausencias tercero, las secciones que los bots no visitan, el contenido nuevo que tarda en recibir su primera visita, las páginas huérfanas confirmadas en su abandono, la frecuencia de rastreo como termómetro del interés del buscador por cada zona del sitio. Los bots de IA cierran la lectura moderna: los agentes de los motores conversacionales identificados en los logs, quién te lee, con qué frecuencia, qué consume, la evidencia del canal GEO de esta serie visitando tu casa con nombre y fecha en cada línea.
Las herramientas gratuitas y el flujo de análisis
El análisis no exige software caro: la hoja de cálculo para los logs chicos, el archivo importado con sus columnas separadas, los filtros por agente y código, las tablas dinámicas que cuentan visitas por URL, el análisis artesanal que responde la mayoría de preguntas, las herramientas gratuitas de análisis de logs para los volúmenes medios, los analizadores de línea de comandos donde el acceso lo permita, y el analizador de logs de Screaming Frog como el puente natural de esta serie, la versión de la herramienta que cruza los logs con el rastreo propio, las URLs rastreadas por los bots contra las que tu sitio tiene, los huecos de ambos lados visibles. El flujo práctico ordena el trabajo: el log filtrado a los bots que importan, los agentes verificados por IP donde la suplantación se sospeche, los bots falsos que se hacen pasar por Google descartados, las cuatro preguntas respondidas en orden, qué rastrean más, qué errores reciben, qué ignoran, cuánto se desperdicia, y las acciones derivadas a las guías de esta serie, el robots que corta el waste, las correcciones de errores, el enlazado que acerca lo ignorado, [DATO-KOM: hallazgo típico de los análisis de logs de KOM, el patrón de waste o error encontrado con frecuencia]. La frecuencia honesta cierra: el análisis trimestral o ante síntomas para el sitio típico, la herramienta de diagnóstico profundo que no exige rutina semanal, pero que cuando se necesita, nada la reemplaza, porque ningún panel agrega lo que la fuente cruda contiene completo.
Preguntas frecuentes
¿El análisis de logs vale la pena para un sitio chico?
Como diagnóstico puntual sí: el sitio chico con problemas de indexación encuentra en los logs la respuesta que los paneles no dan, los errores a bots, el bloqueo accidental, y como rutina pesada no, la consola y el rastreo mensual de esta serie cubren la vigilancia normal. La regla práctica: los logs se leen cuando algo no cuadra, y saber leerlos es la diferencia entre resolver y adivinar.
¿Cómo distingo el bot real de Google de uno falso?
Por verificación de IP: los agentes se declaran en texto y cualquiera puede falsificarlos, los bots se verifican con la búsqueda inversa de sus IPs contra los rangos oficiales, el método que los buscadores documentan, y los falsos abundan, los scrapers disfrazados que inflan tus conteos. El análisis serio verifica antes de concluir: el rastreo aparente de Google que era un scraper cambia todo el diagnóstico.
¿Qué hago si veo bots de IA rastreando mi sitio?
Leerlo como el dato estratégico que es: qué agentes te visitan, qué contenido consumen, la evidencia de que el canal GEO de esta serie ya te está leyendo, y la decisión de política en el robots de esta serie, los bots alineados con tu estrategia de visibilidad dentro, los que no según tu caso. La visita del bot de IA es información de canal: el sitio que la mira sabe quién lo está aprendiendo.
¿KOM hace análisis de logs como servicio?
Dentro del diagnóstico técnico profundo: la captura y el análisis con las herramientas del caso, los patrones de waste, errores y ausencias documentados, las acciones derivadas implementadas, dentro de la consultoría cotizada en el cotizador online con los precios públicos de siempre. Los logs son la fuente primaria: cuando el problema se resiste a los paneles, ahí está la verdad completa esperando lectura experta.
Tu siguiente paso: descarga el log de acceso de tu panel de hosting y fíltralo por el agente de Google en una hoja de cálculo, la primera lectura de qué rastrea de verdad tu sitio. El análisis completo se cotiza en el cotizador online: tu servidor registra cada visita de cada bot desde siempre, y aprender a leer ese registro es pasar de adivinar el rastreo a verlo con tus propios ojos.








