Gratis Hosting
+ Dominio .com
+ Correos Corporativos
+ Certificado SSL
+ Primer año de servicios 100% Gratis.
+Promoción valida para clientes de Diseño Web, Tiendas Virtuales y Landing Pages.

Responsable: Otorongo Negro E.I.R.L. (KOM) | RUC 20604716595 | Derechos ARCOP: legal@kom.pe · Política de Privacidad

Chunking: cómo los LLMs trocean tu contenido

Chunking de contenido web en fragmentos para sistemas de inteligencia artificial LLM

El chunking es el proceso con el que los sistemas de IA parten tu contenido en fragmentos, o chunks, para indexarlo y recuperarlo después: cuando un asistente responde citando tu web, casi nunca leyó tu página completa, leyó dos o tres fragmentos sueltos. Por eso la regla central de escritura para IA es la autocontención: cada sección debe entenderse sola, sin depender de lo que decía el párrafo anterior. Aquí va el concepto y las reglas prácticas.

¿Qué es el chunking y por qué te afecta aunque no lo veas?

El recorrido típico de tu contenido dentro de un sistema de IA tiene cuatro etapas: el rastreador descarga tu página, un proceso la limpia de menús y adornos, otro la parte en fragmentos de tamaño manejable, y cada fragmento se convierte en una representación numérica que permite buscarlo por significado. Cuando un usuario pregunta algo, el sistema recupera los fragmentos más afines a la pregunta y el modelo redacta con ellos.

La consecuencia comercial es directa: tu página no compite como página, compite como colección de fragmentos. Si tu mejor argumento está repartido entre tres párrafos que se necesitan mutuamente, ningún fragmento lo contiene completo y el sistema recupera el de un competidor que sí se entiende solo. Este es uno de los fundamentos de nuestra guía de GEO para aparecer en ChatGPT, Gemini, Claude y Perplexity, y de cómo redactamos en nuestro servicio de posicionamiento GEO.

Cómo se ve tu artículo después del troceo

Imagina un artículo sobre mantenimiento web cortado por un sistema típico. Un corte posible cae así:

[chunk 14]
...ofrecemos tres planes. El primero incluye
actualizaciones mensuales y copias de seguridad.

[chunk 15]
El segundo agrega monitoreo de seguridad. Esto
es lo que la mayoria de nuestros clientes elige.

El chunk 15 dice el segundo y esto sin que nada dentro del fragmento explique de qué se habla, de qué empresa, ni de qué servicio. Recuperado solo, es ruido. La versión autocontenida diría: el plan intermedio de mantenimiento web agrega monitoreo de seguridad y es el que más eligen las pymes que nos contratan. Mismo dato, fragmento utilizable.

[DATO-KOM: diagrama ilustrado del troceo de una página real para la versión final]

¿Por qué los cortes arbitrarios destruyen tu mensaje?

Porque el corte no respeta tus ideas: respeta tamaños. Los sistemas parten por longitud aproximada, con suerte usando tus encabezados como pistas, y todo lo que dependa de continuidad se rompe. Los tres daños típicos: pronombres huérfanos (esto, aquel, dicho servicio) que pierden su referente, datos separados de su contexto (el precio queda en un fragmento y las condiciones en otro), y conclusiones divorciadas de sus argumentos.

No puedes controlar dónde corta cada sistema, y los tamaños varían entre plataformas. Lo que sí controlas es que cualquier corte razonable produzca fragmentos con sentido. Esa es la diferencia entre escribir para lectores que empiezan desde arriba y escribir para sistemas que entran por cualquier punto.

Las siete reglas de la escritura autocontenida

Regla Qué hacer Señal de fallo
1. Sección autosuficiente Cada H2 se entiende sin leer los anteriores Una sección que empieza con como vimos
2. Sujeto explícito al abrir Nombra el tema y la entidad al inicio de cada sección Párrafos iniciales con esto o el servicio
3. Dato pegado a su contexto Cifra, unidad y condición en la misma oración El precio en un párrafo y el IGV en otro
4. Una idea por sección Si el H2 promete dos cosas, son dos H2 Encabezados con y que abarcan medio artículo
5. Listas con oración previa La línea antes de la lista dice qué enumera Viñetas que no se entienden sin el título
6. Tablas con encabezados claros Columnas que explican la celda por sí mismas Tablas que necesitan el párrafo anterior
7. Respuesta primero Cada sección abre respondiendo, luego matiza Secciones que recién concluyen al final

Ninguna de estas reglas pelea con la buena redacción para humanos: un lector que llega desde Google a mitad de página agradece exactamente lo mismo. Escribir para chunks es escribir para lectores impacientes con memoria corta, que es la descripción honesta de todos nosotros.

Cómo estructurar páginas largas para un troceo limpio

La jerarquía de encabezados es tu herramienta principal, porque los sistemas decentes la usan como guía de corte. Mantén H2 para ideas completas y H3 para sus componentes, con secciones de 150 a 350 palabras: lo bastante largas para contener una idea con su evidencia, lo bastante cortas para caber enteras en un fragmento típico. Una sección de 900 palabras va a ser cortada por la mitad sí o sí.

Cuida también la primera oración de cada sección, que es la que más trabaja: debe contener el tema, la entidad si corresponde y la respuesta corta. Y cierra cada sección de verdad: nada de frases puente hacia la siguiente, porque en el mundo de los fragmentos esa siguiente sección quizá nunca llegue con esta.

¿Cómo comprobar si tu contenido sobrevive al troceo?

La prueba toma diez minutos y no requiere herramientas. Copia una sección cualquiera de tu página, solo esa, y pégala en un asistente con tres preguntas: de qué trata este texto, qué empresa o servicio describe, y qué dato concreto aporta. Si el modelo responde las tres sin inventar, esa sección es un buen fragmento. Repite con dos o tres secciones al azar, especialmente las del medio del artículo, que es donde la autocontención suele morir.

En KOM corremos esta prueba antes de publicar contenido estratégico, y la versión inversa también enseña: pregunta qué falta en este texto para entenderse solo, y el modelo te lista los referentes rotos. Es el editor de fragmentos más barato que existe.

Lo que el troceo premia y lo que castiga en tu web actual

Hay formatos que sobreviven al corte casi por diseño: los bloques de pregunta y respuesta, donde cada par es un fragmento natural; las definiciones que abren con el término y su explicación completa; los pasos numerados con resultado propio; las fichas de servicio con datos agrupados. Si tu web ya usa estos formatos, el chunking te trata bien sin que lo hayas planeado.

Las víctimas habituales son otras: el storytelling extendido donde la idea recién cierra tres párrafos después, las secciones encadenadas que solo funcionan en orden, y las páginas de una sola pieza sin encabezados, donde el sistema corta a ciegas porque no le diste ninguna pista de estructura. Ninguno de estos formatos es malo en sí; son malos como única forma de contar lo que vendes.

Cómo auditar lo que ya tienes publicado

No necesitas reescribir el blog entero. Prioriza por impacto: tus cinco páginas de servicio y las diez entradas que más tráfico orgánico traen concentran la mayoría de las recuperaciones posibles. Para cada una, revisa primero el esqueleto: si los encabezados leídos solos cuentan la historia completa de la página, la estructura sirve; si son frases ingeniosas sin contenido, ahí está tu primera corrección.

Después aplica la prueba de la sección suelta a las dos secciones del medio, que es donde se acumulan los pronombres huérfanos. Corrige, publica y pasa a la siguiente página. A razón de una página por semana, en un trimestre tu contenido estratégico queda preparado sin detener la operación.

Preguntas frecuentes

¿Puedo decidir el tamaño de chunk que usan los sistemas?

No: cada plataforma define sus tamaños y estrategias de corte, y cambian sin aviso. Tu control está en la estructura: encabezados jerárquicos, secciones de tamaño moderado y autocontención hacen que casi cualquier estrategia de corte produzca fragmentos útiles. Optimizar para un tamaño exacto sería apostar a un detalle de implementación ajeno.

¿Esto también afecta mi SEO tradicional en Google?

Apunta en la misma dirección. Google lleva años evaluando pasajes específicos de una página para posicionarla por consultas puntuales, y una sección autocontenida es justamente un buen pasaje. La escritura por fragmentos no es una técnica aparte del SEO: es la versión exigente de lo que el buen SEO de contenido ya pedía.

¿Las listas y tablas se trocean mal?

Se trocean bien si están bien construidas: con una oración previa que diga qué enumeran y encabezados de columna explícitos. El riesgo está en las listas largas que continúan una idea externa, o tablas cuyo significado vive en un párrafo lejano. Si la lista o tabla cae sola en un fragmento, debería seguir informando.

¿Conviene repetir mi marca en cada sección?

Con naturalidad, sí: mencionar la entidad y el tema al abrir secciones importantes ayuda a que el fragmento recuperado diga quién eres. Sin naturalidad, no: meter la marca en cada párrafo suena a spam para humanos y modelos por igual. El punto medio es nombrarla donde un lector que entra por esa sección la necesitaría.

Tu siguiente paso: toma tu página de servicios más importante, corre la prueba de la sección suelta y corrige las dos secciones que peor respondan. Con eso ya escribes para el medio en el que de verdad te leen los modelos: en pedazos.

Picture of Christian Otero
Christian Otero
Founder & CEO @ KOM Agencia Digital | Pionero en Generative Engine Optimization (GEO) y SEO Técnico Internacional | +24 Años escalando operaciones digitales | Ex-Nextel, Entel, Prosegur | Ingeniero de Sistemas con Postgrado en Marketing Digital y Comercio Exterior.
Artículos relacionados
¿Buscas diseñar tu página web?

Escríbenos:

Responsable: Otorongo Negro E.I.R.L. (KOM) | RUC 20604716595 | Derechos ARCOP: legal@kom.pe · Política de Privacidad

¿Preguntas?
¡Te asesoramos gratis!

Responsable: Otorongo Negro E.I.R.L. (KOM) | RUC 20604716595 | Derechos ARCOP: legal@kom.pe · Política de Privacidad

Si prefieres llámanos o escríbenos...

Estamos atentos a tu comunicación para poder implementar tus nuevas herramientas digitales.

EMPRESA REGISTRADA Ante SUNAT e INDECOPI PAGO 100% SEGURO A través de KOM Pay TRANSPARENCIA TOTAL Precios 100% Públicos POTENCIADOS CON IA Usamos Inteligencia Artificial