Gratis Hosting
+ Dominio .com
+ Correos Corporativos
+ Certificado SSL
+ Primer año de servicios 100% Gratis.
+Promoción valida para clientes de Diseño Web, Tiendas Virtuales y Landing Pages.

Responsable: Otorongo Negro E.I.R.L. (KOM) | RUC 20604716595 | Derechos ARCOP: legal@kom.pe · Política de Privacidad

llms-full.txt: cuándo usarlo y cómo generarlo automáticamente

Archivo llms-full.txt abierto en editor de código junto a panel de configuración WordPress

El llms-full.txt es la versión extendida del llms.txt: en lugar de enlaces curados, contiene el texto completo de tus páginas importantes en un solo archivo, para que un modelo lea todo tu contenido esencial sin navegar. Conviene en sitios de documentación, blogs con guías de fondo y SaaS; sobra en tiendas con catálogo cambiante y en webs de cinco páginas. Aquí verás cuándo usarlo, sus límites de tamaño prácticos y cómo generarlo automáticamente desde WordPress.

¿Qué es llms-full.txt y en qué se diferencia del llms.txt?

El llms.txt es un índice: título, resumen y enlaces con descripción para que el modelo decida dónde profundizar. El llms-full.txt es la biblioteca entera: el contenido completo de esas páginas, concatenado en texto plano. El primero pesa unos pocos KB y se lee en segundos; el segundo puede pesar cientos y existe para que herramientas y asistentes carguen tu contenido de una sola vez, sin depender de su capacidad de navegación.

Ambos archivos vienen de la misma propuesta comunitaria y conviven en la raíz del dominio. El contexto completo de por qué estos archivos importan para tu visibilidad está en nuestra guía de GEO para aparecer en ChatGPT, Gemini, Claude y Perplexity, y su implementación es parte del trabajo técnico de nuestro servicio de posicionamiento GEO.

¿Cuándo conviene tenerlo y cuándo es innecesario?

Conviene cuando tu valor vive en contenido extenso y estable. Documentación de producto: un usuario pega tu llms-full.txt en un asistente y le pregunta cómo configurar algo, con tu doc completa como contexto. Blogs con guías evergreen: el archivo convierte tu conocimiento en un paquete portable que cualquier modelo puede citar con fidelidad. Servicios con metodología propia: tu forma de trabajar, explicada completa, sin depender de qué página encuentre el rastreador.

Es innecesario, y hasta contraproducente, en tres casos. Tiendas con catálogo grande: precios y stock cambian más rápido de lo que regeneras el archivo, y un modelo con datos viejos responde mal por ti. Sitios de pocas páginas: el llms.txt simple ya cubre todo. Y contenido de actualidad: noticias de la semana pasada empaquetadas como si fueran vigentes confunden más de lo que aportan.

Límites de tamaño prácticos

No hay un límite oficial, pero sí física de los modelos: las ventanas de contexto son finitas y un archivo gigante no se lee completo. La referencia práctica que usamos en KOM:

Contenido del sitio Enfoque recomendado Qué incluir
Hasta 20 páginas de fondo llms-full.txt completo Todas las guías y páginas clave, texto íntegro
20 a 100 páginas llms-full.txt curado Solo lo evergreen que define tu negocio; el resto queda enlazado en llms.txt
Más de 100 páginas o documentación extensa Varios archivos por tema Un full por sección grande, enlazados desde el llms.txt

Como regla de bolsillo: si el archivo pasa de unos cientos de KB de texto, ya no estás curando, estás volcando. Recorta hasta que cada bloque incluido tenga una razón para estar.

Cómo generarlo automáticamente desde WordPress

Mantener el archivo a mano es la receta para abandonarlo. Este snippet lo regenera solo, tomando las entradas de una categoría que tú decides. Va en el functions.php de tu tema hijo o, mejor, en un plugin de snippets:

// Genera llms-full.txt con tus guias publicadas
function kom_generar_llms_full() {
    $posts = get_posts(array(
        'post_type'   => 'post',
        'category_name' => 'guias', // ajusta a tu categoria
        'numberposts' => 50,
        'post_status' => 'publish',
    ));
    $salida = '# ' . get_bloginfo('name') . PHP_EOL;
    $salida .= '> Contenido completo de las guias principales.' . PHP_EOL . PHP_EOL;
    foreach ($posts as $p) {
        $salida .= '## ' . $p->post_title . PHP_EOL;
        $salida .= get_permalink($p) . PHP_EOL . PHP_EOL;
        $salida .= wp_strip_all_tags(apply_filters('the_content', $p->post_content)) . PHP_EOL . PHP_EOL;
    }
    file_put_contents(ABSPATH . 'llms-full.txt', $salida);
}
add_action('kom_llms_full_cron', 'kom_generar_llms_full');
if (!wp_next_scheduled('kom_llms_full_cron')) {
    wp_schedule_event(time(), 'weekly', 'kom_llms_full_cron');
}

Tres notas sobre el código. Usa una categoría dedicada, como guias, para controlar qué entra al archivo sin tocar código cada vez. El filtro the_content procesa shortcodes antes de limpiar el HTML, así no quedan restos de constructores de página. Y la regeneración semanal por cron alcanza para contenido evergreen; si publicas guías a diario, cámbiala a daily.

Prueba después de activarlo: visita tudominio.com/llms-full.txt y verifica que el texto sale limpio, sin etiquetas ni shortcodes sin procesar. Si usas caché o Cloudflare, purga la ruta tras cada regeneración.

¿Cómo mantenerlo sin que se vuelva basura?

El riesgo del archivo automático es la acumulación: en un año, tu categoría de guías tiene 80 entradas y el archivo pesa lo que nadie lee. Tres prácticas lo evitan. Revisa trimestralmente qué entradas siguen mereciendo el lugar y saca de la categoría las que envejecieron. Mantén el límite de numberposts como techo duro, con las más recientes primero. Y agrega una línea de fecha de generación al inicio del archivo, para que cualquier lector, humano o modelo, sepa qué tan fresco es el paquete.

La señal de mantenimiento sano es simple: si le pides a un asistente que responda con tu archivo y alguna respuesta sale desactualizada, el archivo necesita poda, no más contenido.

¿Qué gana un negocio peruano con esto en la práctica?

Un ejemplo aterrizado: una consultora con doce guías metodológicas publicadas genera su llms-full.txt y lo enlaza desde su índice. Un gerente que la está evaluando pega el archivo en su asistente y le pregunta cómo trabajaría este proveedor mi caso. La respuesta sale de las guías reales de la consultora, no de un resumen improvisado del modelo. Ese control sobre la versión de tu negocio que circula en las conversaciones con IA es el beneficio de fondo.

El mismo paquete sirve hacia adentro: tu equipo comercial puede cargarlo en un asistente para redactar propuestas consistentes con tu metodología, y soporte puede responder con el contenido canónico en lugar de improvisar. Un solo archivo, tres usos.

Alternativas si no puedes tocar código

Si el functions.php te queda lejos, tienes tres caminos. El primero: un plugin de snippets de código, que te deja pegar la función de arriba sin editar archivos del tema y desactivarla con un clic si algo falla. El segundo: generar el archivo a mano cada cierto tiempo, copiando tus guías a un documento de texto plano y subiéndolo por FTP; funciona, pero ponle un recordatorio trimestral en el calendario porque el archivo abandonado envejece mal. El tercero: pedírselo a tu agencia como parte del mantenimiento, especificando qué categorías entran y con qué frecuencia se regenera.

Cualquiera de los tres supera a no tener el archivo si tu sitio es del perfil correcto. Elige según quién va a mantenerlo de verdad dentro de seis meses.

Errores frecuentes con llms-full.txt

  • Incluir páginas de producto con precios. Se desactualizan entre regeneraciones y el modelo cita montos viejos.
  • Volcar contenido sin procesar shortcodes. El archivo termina lleno de códigos entre corchetes que ensucian la lectura.
  • Duplicar el sitio completo. Páginas legales, etiquetas, archivos por fecha: nada de eso aporta a un modelo.
  • Olvidar la purga de caché. Regeneras el archivo pero el CDN sigue sirviendo la versión anterior durante semanas.
  • No enlazarlo desde el llms.txt. El índice debería mencionar que existe la versión completa y dónde está.

Preguntas frecuentes

¿El llms-full.txt reemplaza al llms.txt?

No, se complementan con roles distintos: el llms.txt es el índice liviano que cualquier modelo lee en segundos, y el llms-full.txt es el paquete completo para cuando hace falta profundidad. La propuesta original contempla ambos. Si solo vas a mantener uno, que sea el llms.txt: es más barato de cuidar y cubre el caso de uso más frecuente.

¿Los modelos de IA realmente leen este archivo?

La adopción es emergente y desigual, igual que con el llms.txt: algunos rastreadores lo piden, otros no, y eso va a seguir moviéndose. Su valor más concreto hoy es doble: los usuarios pueden cargarlo manualmente en un asistente como contexto de calidad, y tú controlas un paquete canónico de tu contenido en lugar de dejar que cada herramienta arme el suyo.

En general, no. El catálogo cambia con el stock y los precios, y el archivo se regenera con menos frecuencia que tu inventario. Para tiendas, lo que sí aporta es incluir las políticas de envío, cambios y pago, que son estables, y dejar el catálogo en el llms.txt como enlaces a categorías que el modelo puede visitar en vivo.

¿Qué hago con contenido privado o de pago?

Nunca va en el archivo. El llms-full.txt es público por definición: cualquier persona o bot puede descargarlo desde la raíz de tu dominio. Cursos de pago, documentación de clientes o material interno quedan fuera, y conviene revisar el archivo generado la primera vez precisamente para confirmar que ninguna categoría privada se coló en la consulta.

Tu siguiente paso: decide con la tabla de arriba si tu sitio amerita el archivo. Si la respuesta es sí, instala el snippet, genera la primera versión y léela completa antes de publicarla: esa lectura de 15 minutos es tu control de calidad más barato.

Picture of Christian Otero
Christian Otero
Founder & CEO @ KOM Agencia Digital | Pionero en Generative Engine Optimization (GEO) y SEO Técnico Internacional | +24 Años escalando operaciones digitales | Ex-Nextel, Entel, Prosegur | Ingeniero de Sistemas con Postgrado en Marketing Digital y Comercio Exterior.
Artículos relacionados
¿Buscas diseñar tu página web?

Escríbenos:

Responsable: Otorongo Negro E.I.R.L. (KOM) | RUC 20604716595 | Derechos ARCOP: legal@kom.pe · Política de Privacidad

¿Preguntas?
¡Te asesoramos gratis!

Responsable: Otorongo Negro E.I.R.L. (KOM) | RUC 20604716595 | Derechos ARCOP: legal@kom.pe · Política de Privacidad

Si prefieres llámanos o escríbenos...

Estamos atentos a tu comunicación para poder implementar tus nuevas herramientas digitales.

EMPRESA REGISTRADA Ante SUNAT e INDECOPI PAGO 100% SEGURO A través de KOM Pay TRANSPARENCIA TOTAL Precios 100% Públicos POTENCIADOS CON IA Usamos Inteligencia Artificial