Saltar al contenido
GEO

Qué es llms.txt y cómo ayuda a los buscadores de IA

Definición

llms.txt es un archivo de texto plano que se sirve en la raíz del dominio (https://tudominio.com/llms.txt) y contiene una descripción estructurada de la empresa, productos, pricing y políticas, pensada específicamente para ser leída por motores de IA generativa (ChatGPT, Claude, Perplexity). Es el equivalente moderno a robots.txt pero para LLMs.

Para qué sirve

El estándar fue propuesto por Jeremy Howard (Answer.AI) en 2024 y se está consolidando como buena práctica GEO. La estructura típica es markdown jerárquico: H1 con el nombre de la empresa, secciones con servicios, pricing, contacto, identidad legal y enlaces a páginas detalladas. La idea es darle a la IA una vista resumida de "quién eres y qué ofreces" sin que tenga que rastrear toda la web.

A diferencia de un sitemap (que es para crawlers de buscadores), llms.txt está pensado para ser interpretado por modelos de lenguaje en el momento del fine-tuning, indexación o respuesta en tiempo real (cuando el bot del LLM rastrea para responder a un usuario).

Ejemplo aplicado

STAKKER SYSTEMS sirve su llms.txt en https://stakker.es/llms.txt con sus 4 packs de pricing, ICP, stack técnico declarado, contacto, fiscal y URLs de servicios. Cuando ChatGPT recibe una pregunta sobre "agencias de IA en Málaga", el bot puede leer ese llms.txt como fuente concisa y citar STAKKER con los datos correctos.

Cuándo merece la pena

  • Tienes una marca o producto que quieres que LLMs describan correctamente.
  • Tu pricing y servicios cambian poco y los puedes mantener actualizados en un único archivo.
  • Compites en sectores donde los usuarios investigan con IA antes de comprar.
  • Tu sitio es estático o se rebuild fácilmente: actualizar llms.txt es trivial.

Errores comunes

  • Llenar el archivo con marketing en lugar de hechos verificables. Los LLMs penalizan la propaganda y favorecen datos concretos.
  • Inconsistencia entre llms.txt y la web pública. Si las cifras no cuadran, la IA pierde confianza.
  • Bloquear los bots de IA en robots.txt mientras publicas llms.txt. Contradicción que reduce tu indexación.
  • Olvidar incluir entidad legal (nombre fiscal, NIF/CIF, sede). Refuerza la confianza para LLMs y para usuarios.
  • No actualizar llms.txt cuando cambia el pricing. Los LLMs rastrean periódicamente y citan datos antiguos.

Cómo lo usa STAKKER SYSTEMS

STAKKER SYSTEMS publica su propio llms.txt como parte del setup GEO Foundation (600+80). Incluye verificación de coherencia con la web pública, ai-instructions.md complementario y robots.txt optimizado para los principales bots IA (GPTBot, ClaudeBot, PerplexityBot, etc.). Lo aplicamos también a clientes que contratan GEO.

Preguntas frecuentes

¿llms.txt es un estándar oficial?

Es propuesta de Jeremy Howard (2024) sin organismo formal detrás todavía. En la práctica, la mayoría de LLMs serios lo respetan y mucha web técnica ya lo publica.

¿Tengo que actualizar llms.txt manualmente?

Sí, salvo que tengas un script de build que lo regenere desde una fuente única. STAKKER lo regenera automáticamente desde data/pricing.ts y la base de servicios.

¿Hay diferencia entre llms.txt y ai-instructions.md?

Sí. llms.txt es el archivo concreto en raíz que sigue la convención del estándar. ai-instructions.md es un complemento opcional con instrucciones más técnicas dirigidas a los LLMs (cómo deben describirte, qué evitar). STAKKER publica ambos.

¿Si publico llms.txt aparezco automáticamente en ChatGPT?

No, pero subes mucho las probabilidades. ChatGPT necesita rastrear tu sitio (depende de SEO, autoridad y enlaces entrantes), entender tu nicho y considerarte fiable. llms.txt es solo una de varias señales, pero importante.

Términos relacionados

¿Quieres aplicar llms.txt a tu negocio?

Diagnóstico gratuito de 30 min. Te decimos exactamente qué encaja con tu caso, qué cuesta y qué tarda.