Gratis Hosting
+ Dominio .com
+ Correos Corporativos
+ Certificado SSL
+ Primer año de servicios 100% Gratis.
+Promoción valida para clientes de Diseño Web, Tiendas Virtuales y Landing Pages.

Responsable: Otorongo Negro E.I.R.L. (KOM) | RUC 20604716595 | Derechos ARCOP: legal@kom.pe · Política de Privacidad

Qué es el archivo llms.txt y cómo crearlo paso a paso

qué es llms.txt — GEO y motores de IA en Perú | KOM Agencia Digital

llms.txt: el archivo que promete (o no) acercarte a la IA

Desde 2024, hay un tema que aparece cada vez más en conversaciones sobre SEO técnico y motores generativos: el archivo llms.txt. Algunos lo presentan como la versión moderna del robots.txt para la era de la inteligencia artificial. Otros lo descartan como una moda que todavía no demostró nada. La verdad es más matizada y vale la pena revisarla con calma, sobre todo si manejas una web en Perú y te están vendiendo este archivo como la próxima gran cosa.

En este artículo te explico qué es llms.txt exactamente, qué propone su creador Jeremy Howard, cómo crearlo paso a paso en WordPress, en qué se diferencia de robots.txt y sitemap, y el debate honesto sobre su impacto real. Porque sí, llms.txt es una práctica emergente y experimental, no una técnica garantizada. Y si alguien te dice lo contrario, conviene revisar las fuentes.

Qué es llms.txt en términos simples

llms.txt es un archivo de texto plano que vive en la raíz de tu sitio web, igual que robots.txt o sitemap.xml. Su propósito declarado es ofrecer a los modelos de lenguaje grandes (LLM, por sus siglas en inglés) una versión condensada y bien organizada del contenido relevante de tu sitio. La idea es que un modelo, cuando llegue a tu dominio, pueda leer este archivo y entender qué páginas son importantes, qué tratan y dónde encontrar más información.

El formato es Markdown, lo cual facilita su lectura tanto por humanos como por máquinas. Incluye títulos jerárquicos, breves descripciones y enlaces a las páginas más importantes del sitio. Algunas implementaciones añaden también un archivo llms-full.txt que contiene el contenido completo en formato unificado, pensado para que el modelo lo procese de un tirón sin tener que navegar página por página.

Hasta aquí, suena lógico. El problema es que llms.txt es una propuesta, no un estándar. Nadie está obligado a respetarlo, no existe un consorcio que lo gobierne y, sobre todo, los principales actores del ecosistema de IA aún no han confirmado que lo lean ni que lo usen para nada.

Quién lo propuso y por qué

llms.txt fue propuesto por Jeremy Howard en 2024. Howard es una figura reconocida en el mundo del aprendizaje profundo, cofundador de fast.ai y autor de varios trabajos sobre democratización del acceso a la IA. Su argumento para llms.txt es elegante: los modelos de lenguaje tienen ventanas de contexto limitadas y los sitios web son cada vez más complejos. Si un modelo intenta procesar un sitio entero, gasta tokens en plantillas, banners, menús, scripts y otros elementos que no aportan información sustantiva.

La propuesta de Howard es que cada sitio ofrezca, voluntariamente, una versión limpia y curada de su contenido en Markdown, optimizada para la lectura por modelos. Así el modelo no necesita raspar HTML ni pelearse con JavaScript, simplemente lee un archivo plano que el propietario del sitio ya organizó para él. Es un planteamiento generoso: tú haces el trabajo de curaduría y el modelo, en teoría, te lo agradece citándote mejor.

La propuesta tuvo eco rápido. En cuestión de meses, blogs técnicos, herramientas SEO y agencias empezaron a hablar de llms.txt como si fuera un estándar emergente. Algunos plugins de WordPress añadieron funciones para generarlo automáticamente. Pero el ruido no es lo mismo que la adopción real por parte de los motores.

El debate sobre su impacto real

Aquí es donde hay que ser honesto. A mayo de 2026, no hay evidencia comprobada de que llms.txt tenga un efecto medible en cómo los motores generativos te leen o te citan. Esa es la postura que vemos en KOM después de revisar las pruebas hechas por la industria.

Google fue explícito: declaró que ignora llms.txt. Ni Googlebot ni los sistemas detrás de AI Overviews usan este archivo para nada. Si tu única esperanza era que Google priorizara tu contenido por tener llms.txt bien hecho, conviene reajustar las expectativas.

Search Engine Land publicó un análisis que no halló correlación entre tener llms.txt y aparecer en respuestas de ChatGPT, Perplexity u otros motores generativos. Los sitios con llms.txt no mostraron mejor visibilidad que los sitios sin llms.txt, una vez controladas otras variables como autoridad de dominio, calidad de contenido y estructura técnica.

OpenAI, Anthropic y Perplexity tampoco han declarado oficialmente que sus crawlers usen llms.txt. Algunos modelos pueden leerlo si se les indica explícitamente, pero no parece formar parte del flujo automático de indexación.

Entonces, ¿es inútil? No exactamente. Es una práctica emergente y experimental. Puede que en uno o dos años algún motor lo incorpore. Puede que sirva para casos específicos, como ayudar a agentes de IA que quieras conectar a tu sitio. Pero hoy, presentarlo como técnica garantizada para mejorar tu visibilidad en IA es deshonesto. Esto es crítico entenderlo antes de invertir tiempo o dinero en implementarlo.

Por qué algunos profesionales lo recomiendan igual

Aun con el debate abierto, hay razones razonables para crear un llms.txt en tu sitio. Primero, es prácticamente gratis. Crear el archivo toma poco tiempo si tu sitio no es enorme, y no afecta nada existente. No hace daño tenerlo.

Segundo, sirve como ejercicio de claridad. Para armar un llms.txt útil, tienes que decidir cuáles son tus 10, 20 o 30 páginas más importantes y resumirlas en pocas líneas. Ese ejercicio, en sí mismo, te ayuda a entender mejor la arquitectura de tu sitio y a detectar contenidos que están enterrados o mal posicionados.

Tercero, si algún día los motores generativos sí lo adoptan, ya lo tendrás listo. Es una apuesta de bajo costo y posible alto retorno futuro.

Cuarto, ayuda a agentes de IA personalizados. Si construyes un agente que tiene que recorrer tu propio sitio para responder preguntas internas, llms.txt le simplifica la vida. Empresas que despliegan asistentes en sus propias webs encuentran utilidad en este archivo aunque Google y otros buscadores lo ignoren.

Diferencias entre llms.txt, robots.txt y sitemap.xml

Conviene ubicar estos tres archivos en su lugar para no confundirlos. robots.txt es un estándar antiguo y respetado. Le dice a los crawlers qué partes del sitio pueden o no rastrear. Es un mecanismo de control de acceso. Si bloqueas una carpeta en robots.txt, los buscadores serios la respetan.

sitemap.xml es otro estándar maduro. Le da a los buscadores una lista estructurada de todas las URLs que quieres que indexen, con metadatos como fecha de última modificación y prioridad. Google, Bing y otros lo usan activamente para descubrir contenido.

llms.txt es distinto. No restringe acceso, no lista URLs en formato XML, no es respetado por Google ni por los grandes crawlers. Es más parecido a un resumen ejecutivo de tu sitio escrito en Markdown, pensado para que un modelo de lenguaje lo lea y entienda el contexto. Por eso decir «es como el robots.txt para IA» es una analogía que falla en lo importante: robots.txt funciona y se respeta, llms.txt aún no.

Eso sí, los tres archivos pueden convivir sin problema. Tener llms.txt no afecta a robots.txt ni a sitemap.xml. No se interfieren entre sí.

Cómo crear un llms.txt paso a paso

Si decides crear uno, el proceso es sencillo. Lo importante es que sepas que estás experimentando, no implementando una solución probada.

Primero, abre un editor de texto cualquiera y crea un archivo nuevo. El formato es Markdown, así que las extensiones más comunes son .txt o .md. Por convención, el archivo debe llamarse llms.txt y vivir en la raíz de tu dominio, accesible en tudominio.com/llms.txt.

Segundo, define el encabezado. Empieza con un título de primer nivel que sea el nombre de tu sitio o empresa. Por ejemplo: # KOM Agencia Digital. Inmediatamente abajo, agrega una línea con una descripción breve, idealmente en formato de cita Markdown, que explique de qué se trata el sitio en una o dos oraciones.

Tercero, organiza el contenido en secciones. Cada sección lleva un título de segundo nivel y agrupa enlaces relacionados. Por ejemplo, podrías tener secciones como Servicios, Casos de éxito, Blog principal o Recursos. Dentro de cada sección, lista los enlaces más importantes con un formato simple: el título de la página, un guion y una breve descripción de lo que contiene.

Cuarto, sé selectivo. La idea no es listar 500 URLs, es ofrecer una curaduría. Quédate con las 20 o 30 páginas que realmente representan lo que ofreces. Si el modelo quiere más detalle, hará clic. Si el archivo es demasiado largo, pierde su propósito.

Quinto, sube el archivo a la raíz de tu sitio. Si usas WordPress, puedes hacerlo por FTP, por el administrador de archivos de tu hosting o usando plugins que añaden archivos a la raíz. Algunos plugins SEO ya empezaron a incluir generadores automáticos de llms.txt como función opcional.

Sexto, verifica que sea accesible. Entra desde un navegador a tudominio.com/llms.txt y confirma que veas el contenido. Si te aparece un error 404, revisa la ubicación y los permisos del archivo.

Cómo crear llms.txt en WordPress sin tocar código

Para una web WordPress típica, hay tres caminos prácticos. El primero es usar un plugin que ya tenga la función. A partir de 2025 varios plugins SEO conocidos añadieron generadores de llms.txt en sus paneles. Activas la función, ajustas qué páginas incluir, y el plugin se encarga de servir el archivo en la URL correcta. Es la opción más cómoda si ya usas alguno de esos plugins.

El segundo camino es usar un plugin específico para archivos raíz. Hay varios plugins gratuitos que te permiten crear archivos en la raíz del sitio sin tocar FTP. Subes el contenido, le pones el nombre llms.txt y lo guardas. WordPress hace el resto.

El tercer camino es manual. Te conectas por FTP o por el administrador de archivos del hosting, navegas a la carpeta raíz del sitio (donde están wp-config.php y .htaccess), creas un archivo llamado llms.txt y pegas el contenido. Recargas y listo.

Si tu hosting es peruano y compartido, conviene confirmar con soporte que el archivo llms.txt no esté siendo interceptado por alguna regla del servidor. En general no debería pasar, pero algunas configuraciones más estrictas filtran extensiones .txt poco comunes.

Qué incluir y qué dejar fuera

Como llms.txt no tiene un estándar oficial firme, hay margen. Lo que sí está claro es que el archivo debe ser útil para un modelo que intenta entender tu sitio en pocos segundos.

Incluye páginas que representen tu propuesta de valor: servicios, productos, casos, equipo. Incluye contenidos pilares de tu blog que cubran temas importantes con profundidad. Incluye recursos descargables si los tienes. Incluye la página de contacto, porque a veces un modelo necesita saber cómo dirigir a un usuario hacia ti.

Deja fuera entradas viejas o de poca relevancia. Deja fuera páginas duplicadas, archivos generados automáticamente o secciones que no representan lo que haces hoy. Si tienes 500 entradas de blog pero solo 20 son citables y útiles, lista esas 20.

Mantén las descripciones breves. Una o dos líneas por enlace es suficiente. Los modelos prefieren texto denso y claro a párrafos largos llenos de adjetivos.

Cuándo no vale la pena armar un llms.txt

Hay casos donde el esfuerzo no se justifica. Si tu sitio es muy pequeño (menos de 10 páginas), el llms.txt aporta poco porque un modelo puede leer todo el sitio sin problema. Si tu sitio cambia a diario y mantener el archivo actualizado se vuelve carga operativa, conviene esperar a ver si se vuelve estándar antes de invertir tiempo en gestión.

Si tu prioridad SEO sigue siendo Google clásico, tu energía rinde más en estructura técnica, contenido de calidad y velocidad de carga que en crear un archivo que Google declaró ignorar.

Y si alguien te ofrece llms.txt como producto pagado prometiendo «asegurar tu visibilidad en IA», revisa esa promesa con lupa. Ningún profesional honesto puede garantizar eso hoy.

Preguntas frecuentes sobre llms.txt

¿llms.txt es un estándar oficial?

No. Es una propuesta hecha por Jeremy Howard en 2024 que ganó visibilidad en círculos técnicos, pero no es un estándar ratificado por ningún organismo como el W3C ni reconocido oficialmente por los principales actores del ecosistema de IA. Es una práctica emergente y experimental.

¿Google lee llms.txt?

Google declaró que ignora llms.txt. Ni Googlebot ni los sistemas detrás de AI Overviews lo usan. Si tu objetivo es mejorar tu presencia en Google, este archivo no aporta nada.

¿ChatGPT lee llms.txt?

OpenAI no ha confirmado que ChatGPT use llms.txt como parte de su flujo automático. Puede ser leído si se le indica explícitamente al modelo, pero no parece estar en el proceso estándar de búsqueda. La evidencia disponible no muestra impacto medible.

¿En qué se diferencia llms.txt de robots.txt?

robots.txt es un estándar antiguo y respetado que controla el acceso de crawlers a partes del sitio. llms.txt es un resumen del contenido en Markdown pensado para modelos, no controla acceso ni es respetado por los grandes motores. Coexisten sin interferirse.

¿Tener llms.txt mejora mi posicionamiento?

No hay evidencia comprobada de que tener llms.txt mejore tu visibilidad ni en buscadores tradicionales ni en motores generativos. Search Engine Land no halló correlación. Tratarlo como técnica garantizada es deshonesto. Puede ser útil como ejercicio interno o para agentes propios, pero no como palanca SEO.

¿Cuántas URLs debe contener llms.txt?

No hay una regla fija. La práctica habitual sugiere entre 20 y 50 enlaces, organizados por temas. El objetivo es curaduría, no exhaustividad. Si tu archivo crece mucho pierde su propósito de ser un resumen útil para un modelo.

¿Puedo tener llms.txt y sitemap.xml a la vez?

Sí, los dos archivos cumplen funciones diferentes y no se interfieren. sitemap.xml sigue siendo necesario para que los buscadores tradicionales descubran tu contenido. llms.txt es un complemento experimental enfocado en modelos generativos.

¿Debo actualizar llms.txt cada vez que publico algo?

Solo si el contenido nuevo entra en la curaduría que decidiste mostrar. La idea es que llms.txt refleje tus contenidos pilares, no cada entrada de blog. Una revisión cada uno o tres meses suele ser suficiente para mantenerlo coherente con la realidad del sitio.

¿Hay plugins de WordPress para generar llms.txt?

Sí, desde 2025 varios plugins SEO incorporaron generadores automáticos de llms.txt. También existen plugins específicos para crear archivos raíz desde el panel. Y siempre queda la opción de subir el archivo manualmente por FTP.

¿Vale la pena invertir tiempo en llms.txt en 2026?

Para la mayoría de webs peruanas, no como prioridad. Vale la pena hacerlo si tu sitio es mediano o grande, el proceso te toma menos de dos horas y entiendes que es una apuesta a futuro sin retorno comprobado. No vale la pena pagar consultorías que prometen resultados garantizados con este archivo, porque hoy nadie puede garantizarlos.

Picture of Christian Otero
Christian Otero
Founder & CEO @ KOM Agencia Digital | Pionero en Generative Engine Optimization (GEO) y SEO Técnico Internacional | +24 Años escalando operaciones digitales | Ex-Nextel, Entel, Prosegur | Ingeniero de Sistemas con Postgrado en Marketing Digital y Comercio Exterior.
Artículos relacionados
¿Buscas diseñar tu página web?

Escríbenos:

Responsable: Otorongo Negro E.I.R.L. (KOM) | RUC 20604716595 | Derechos ARCOP: legal@kom.pe · Política de Privacidad

¿Preguntas?
¡Te asesoramos gratis!

Responsable: Otorongo Negro E.I.R.L. (KOM) | RUC 20604716595 | Derechos ARCOP: legal@kom.pe · Política de Privacidad

Si prefieres llámanos o escríbenos...

Estamos atentos a tu comunicación para poder implementar tus nuevas herramientas digitales.

EMPRESA REGISTRADA Ante SUNAT e INDECOPI PAGO 100% SEGURO A través de KOM Pay TRANSPARENCIA TOTAL Precios 100% Públicos POTENCIADOS CON IA Usamos Inteligencia Artificial