¿Pensando en implementar llms.txt? Lee esto primero: Podrías no obtener los resultados que esperas
En los últimos meses, el concepto de implementar llms.txt ha captado la atención de muchos profesionales del SEO y, con ellos, a muchas plataformas sociales.
La idea es simple: ofrecer un archivo que indique a los grandes modelos de lenguaje (LLMs, por sus siglas en inglés) qué contenido pueden o no utilizar para entrenarse, generar respuestas y hacer citaciones.
A primera vista, suena como la evolución natural del famoso robots.txt que tanto hemos usado para guiar a los motores de búsqueda.
Sin embargo, la adopción real de llms.txt aún está en pañales. Las principales compañías que lideran el desarrollo de inteligencia artificial, tales como OpenAI, Google, Microsoft o Perplexity, no lo han incorporado oficialmente en sus procesos. Por ello, surge una pregunta clave: ¿Tiene sentido invertir tiempo y recursos en implementarlo hoy?
En este artículo le echaré (o echaremos, si me acompañas) un ojo a lo que plantean los promotores de la implementación de llms.txt, sus posibles ventajas y por qué, bajo mi perspectiva, podría no ser la prioridad en este momento.
Tabla de contenidos: Consideraciones sobre implementar llms.txt
- Tabla de contenidos: Consideraciones sobre implementar llms.txt
- ¿Qué es llms.txt?
- Origen y contexto del debate
- Ventajas del llms.txt (de acuerdo a sus promotores)
- Por qué creo que no vale la pena usar llms.txt actualmente
- Comparativa con otras herramientas SEO
- Mis recomendaciones para el presente y el futuro cercano respecto a llms.txt
- Conclusiones
- FAQ sobre la implementación de llms.txt
- Bibliografía
¿Qué es llms.txt?
El archivo llms.txt es una propuesta no oficial que busca crear un canal de comunicación entre los propietarios de contenido (websites, típicamente) y los desarrolladores de modelos de lenguaje (como OpenAI).
En su formulación original, llms.txt es un archivo de texto Markdown situado en la raíz del dominio que expone, de forma humana y legible, una lista de URLs “preferidas” para que los LLMs las consulten durante la inferencia (no para entrenamiento), junto con notas de contexto y posibles exclusiones.
La propuesta se dio a conocer el 3 de septiembre de 2024, con ejemplos de formato y convenciones (Howard, 2024a; 2024b). Search Engine Land describió esta propuesta como un “mapa del tesoro” para IA, útil para destacar documentación, FAQs y guías clave.
Su surgimiento responde a la creciente preocupación por la propiedad intelectual y la transparencia en el uso de datos para IA. Con cada vez más empresas utilizando chatbots, assistants y motores de búsqueda impulsados por IA, la idea de tener control sobre qué contenido se comparte con ellos ha generado interés, así como demandas por violación de propiedad intelectual. Para muestra basta un botón:
- Reddit vs Anthropic.
- The New York Times vs OpenAI y Microsoft.
- Disney y NBC Universal vs Midjourney.
- Nicholas Basbanes y Nicholas Gage vs Open AI y Microsoft.
Sin embargo, la diferencia fundamental es que robots.txt se convirtió en estándar porque gigantes como Google y Bing lo adoptaron rápidamente. Con llms.txt, esto aún no ocurre. Ni OpenAI, ni Anthropic, Ni Google, ni otros actores relevantes lo reconocen como parte de sus protocolos.
Esto nos deja en un limbo: una herramienta con potencial, pero sin el respaldo necesario para garantizar que su implementación tenga impacto real en cómo la IA interactúa con nuestros contenidos.
Origen y contexto del debate
El debate en torno a implementar llms.txt nació del crecimiento exponencial de los modelos de lenguaje y del impacto que tienen en la forma en que los usuarios consumen información. Plataformas como ChatGPT, Claude o Gemini pueden sintetizar grandes volúmenes de contenido y ofrecer respuestas en segundos, lo que ha generado inquietud entre creadores y empresas de medios debido a las posibles violaciones de derechos de autor, así como al descenso del tráfico a los sitios web.
La pregunta es: si los LLMs están utilizando nuestro contenido para entrenarse o responder preguntas, ¿no deberíamos tener una forma de decidir qué se usa y qué no? Ahí es donde entra llms.txt.
Los primeros en proponerlo fueron grupos de desarrolladores independientes y algunos expertos en ética de IA, quienes vieron en este archivo una oportunidad para ofrecer un mecanismo sencillo, no invasivo y técnicamente fácil de implementar.
Pero mientras que algunos lo ven como un paso hacia la transparencia, otros cuestionan su viabilidad. Por ejemplo, al no ser obligatorio ni estar respaldado por estándares internacionales, nada garantiza que las empresas de IA realmente respeten sus directrices. Recordemos que algunos LLMs ni siquiera respetan las directivas de los robots.txt, ¿verdad, Anthropic y Open AI?
Además, incluso si se adoptara, habría limitaciones técnicas: los LLMs podrían haberse entrenado previamente con contenido antes de que el archivo existiera, y eliminar ese conocimiento no es tan simple.
Este contexto es clave para entender por qué, pese al entusiasmo inicial, la adopción de llms.txt sigue siendo mínima.

Ventajas del llms.txt (de acuerdo a sus promotores)
Los defensores de implementar llms.txt argumentan que este archivo podría ofrecer múltiples beneficios:
- Control sobre el contenido: Permitiría a los propietarios decidir qué partes de su sitio pueden ser usadas para entrenar LLMs.
- Protección de derechos de autor: Ayudaría a mitigar riesgos relacionados con propiedad intelectual.
- Transparencia: Al ser público, cualquier usuario podría ver la política del sitio respecto a IA.
- Implementación sencilla: Técnicamente sería tan fácil de configurar como un robots.txt, como lo indican Mintlify y ahrefs.
- Potencial para convertirse en estándar: Si grandes compañías lo adoptaran, podría integrarse a las mejores prácticas de SEO y contenido.
Para sitios con información altamente sensible (como investigaciones académicas, datos propietarios o contenido con valor comercial), la posibilidad de limitar su uso por parte de modelos de IA resulta, sin duda alguna, atractiva.
Además, los promotores también resaltan que llms.txt podría ser útil para experimentos con SEO orientado a IA, donde las empresas analicen qué tipo de contenido genera más visibilidad en respuestas conversacionales.
Sin embargo, todas estas ventajas son teóricas. Hasta que no exista respaldo formal por parte de los principales actores del ecosistema, cualquier beneficio será marginal. Por eso, en la siguiente sección explicaré por qué, bajo mi perspectiva, implementar llms.txt hoy podría no ser la mejor inversión del recurso más importante que tenemos: El tiempo.
Por qué creo que no vale la pena usar llms.txt actualmente
Pese a las ventajas antes mencionadas, mi postura es, cuando menos, escéptica y, por ello, si alguien me preguntase si recomiendo implementar llms.txt yo diría NO por cinco razones principales:
- Falta de adopción oficial: Ninguno de los grandes jugadores de IA lo ha integrado en sus procesos. Implementarlo ahora es como construir señales de tráfico que nadie respeta.
- Beneficio SEO inexistente: A diferencia de robots.txt o sitemaps, no impacta en la indexación ni en el ranking orgánico.
- Limitaciones técnicas: Los LLMs no pueden “olvidar” contenido ya entrenado. Bloquear el acceso presente (o futuro) no cambia el pasado.
- Alternativas más efectivas: Datos estructurados, schema markup y sitemaps ya cumplen funciones clave para guiar a bots e IA, como se indica acá.
- Prioridades en SEO: La optimización técnica, la velocidad del sitio y la calidad del contenido siguen siendo factores más críticos.
En pocas palabras, llms.txt es una idea interesante, pero prematura. Dedicar recursos a configurarlo podría generar una falsa sensación de control sin ofrecer beneficios tangibles.
Comparativa con otras herramientas SEO
Si comparamos llms.txt con herramientas consolidadas, vemos cómo ya existen opciones que pueden resultar mucho más efectivas que la adopción de un estándar que todavía no es reconocido:
- Sitemaps: Indican a los buscadores qué páginas existen y con qué frecuencia deben rastrearse.
- Datos estructurados: Ayudan a los motores de búsqueda a entender el contenido y mostrar resultados enriquecidos.
- Schema Markup: Facilita que la información aparezca en rich snippets o resultados destacados.
Todas estas herramientas ya influyen en cómo la IA y los buscadores interpretan el contenido. llms.txt, en cambio, no tiene impacto probado en visibilidad ni en posicionamiento.
Por eso, antes de destinar tiempo a implementar llms.txt, recomendaría reforzar estos elementos técnicos y optimizar la calidad del contenido para responder mejor a las preguntas de los usuarios.
Mis recomendaciones para el presente y el futuro cercano respecto a llms.txt
En un escenario ideal, llms.txt podría evolucionar hacia un estándar oficial, respaldado por empresas líderes y organizaciones de gobernanza tecnológica.
Sin embargo, mientras eso ocurre, mi recomendación es priorizar:
- Optimización técnica: Menos JavaScript y CSS innecesario, sitios más rápidos y limpios.
- Contenido orientado a preguntas: Los LLMs y motores de búsqueda valoran respuestas claras y directas.
- Datos estructurados y sitemaps: Siguen siendo el puente más efectivo entre tu sitio y las plataformas de búsqueda e IA.
Si en el futuro llms.txt se convierte en norma, tendrá sentido evaluarlo. Hoy, la inversión de tiempo y recursos debe enfocarse en lo que sí genera impacto comprobado.
Conclusiones
Por ahora, mi conclusión es simple: no hay que apresurarse a implementar llms.txt. Es mejor concentrarse en la optimización de tu sitio, crear contenido de calidad y mejorar la experiencia del usuario.
Si este tema te interesa y quieres seguir la conversación, te invito a conectar conmigo en LinkedIn, Bluesky y X.com. Desde luego, también te invito a echarle un ojo a otros artículos en la sección SEO de mi blog.
FAQ sobre la implementación de llms.txt
¿Qué es llms.txt?
Un archivo propuesto para indicar a modelos de lenguaje qué contenido pueden usar para entrenarse o generar respuestas.
¿Me ayuda a posicionar mejor en Google?
La verdad es que no. Actualmente no tiene ningún efecto en SEO.
¿Las empresas de IA lo respetan?
Por ahora, ninguna lo ha adoptado oficialmente.
¿Existen mejores alternativas?
Sí: sitemaps, datos estructurados y schema markup.
¿Podría ser útil en el futuro?
Sí, si grandes compañías lo integran como estándar.
Bibliografía
- Ahrefs. (2025, abril). What Is llms.txt, and Should You Care About It? Ahrefs. https://ahrefs.com/blog/what-is-llms-txt/
- Answer.AI. (2024, septiembre 3). /llms.txt—a proposal to provide information to help LLMs use web data responsibly. Answer.AI. https://www.answer.ai/posts/2024-09-03-llmstxt.html
- Fastly. (2025, agosto 19). The Truth About Blocking AI, And How Publishers Can Still Win. Fastly Blog. https://www.fastly.com/blog/the-truth-about-blocking-ai-and-how-publishers-can-still-win
- Howard, J. (2024, septiembre 3). The /llms.txt file. llmstxt.org. https://llmstxt.org/
- Instructor. (2025, marzo 19). Instructor Adopts llms.txt: Making Documentation AI-Friendly. Instructor Blog. https://python.useinstructor.com/blog/2025/03/19/instructor-adopts-llms-txt/
- Mintlify. (2024, septiembre). Simplifying docs for AI with /llms.txt. Mintlify Blog. https://mintlify.com/blog/simplifying-docs-with-llms-txt
- Mintlify. (2025, mayo). The value of llms.txt: Hype or real?. Mintlify Blog. https://mintlify.com/blog/the-value-of-llms-txt-hype-or-real
- Rankability. (2025). LLMS.txt Best Practices & Implementation Guide. Rankability Blog. https://www.rankability.com/guides/llms-txt-best-practices/
- Safari Digital. (2025, julio). Do You Need an LLMS.txt File To Rank in LLMs? Safari Digital. https://www.safaridigital.com.au/blog/do-you-need-an-llms-txt-file/
- Search Engine Journal. (2025, abril). Google Says LLMs.Txt Comparable To Keywords Meta Tag. Search Engine Journal. https://www.searchenginejournal.com/google-says-llms-txt-comparable-to-keywords-meta-tag/544804/
- Search Engine Land. (2025, junio). llms.txt isn’t robots.txt: it’s a treasure map for AI. Search Engine Land. https://searchengineland.com/llms-txt-isnt-robots-txt-its-a-treasure-map-for-ai-456586
- Semrush. (2025, agosto). What Is LLMs.txt & Should You Use It? Semrush. https://www.semrush.com/blog/llms-txt/
- SERoundtable. (2025, junio). Google: No AI System Currently Uses LLMs.txt. SERoundtable. https://www.seroundtable.com/google-ai-llms-txt-39607.html
- Stan Ventures. (2025, junio). Google Dismisses LLMs.txt as Ineffective and Unused by AI Bots. Stan Ventures News. https://www.stanventures.com/news/google-dismisses-llms-txt-as-ineffective-and-unused-by-ai-bots-2479/
- The Verge. (2024, julio 25). Anthropic’s crawler is ignoring websites’ anti-AI scraping policies. The Verge. https://www.theverge.com/2024/7/25/24205943/anthropic-ai-web-crawler-claudebot-ifixit-scraping-training-data
- tryprofound. (2025, febrero). The Role and Functionality of llms.txt in LLM-Driven Web Interactions. Profound. https://www.tryprofound.com/guides/what-is-llms-txt-guide
- withdaydream. (2025, junio). The Case Against llms.txt: Why the Hype Outpaces the Reality. Daydream Library. https://www.withdaydream.com/library/llms-txt-hype-vs-reality
- Yoast. (2025, junio). What AI gets wrong about your site, and why it’s not your fault. Yoast Blog. https://yoast.com/what-ai-gets-wrong-about-your-site-llms-txt/
- Reddit r/SEO. (2025, abril). Are llms.txt really helpful? Reddit. https://www.reddit.com/r/SEO/comments/1juu4wb/are_llmstxt_really_helpful/
- Reddit r/TechSEO. (2025, agosto). llms.txt – does this actually work? Reddit. https://www.reddit.com/r/TechSEO/comments/1mlf6dy/llmstxt_does_this_actually_work_has_anyone_seen/
Comparte esto:
Relacionado
Luis Ignacio
Consultor de Marketing Digital con enfoque en SEO. Escribo también sobre historia (especialmente Porfiriato), videojuegos y me considero un divulgador del turismo y la cultura de Teziutlán (Puebla), la región de la Sierra Nororiental y la región Capital de Veracruz (échale un ojo a La Ruta de la Niebla).
También te puede interesar
Google disminuirá tasa de rastreo para páginas web este 2022
22 enero, 2022
Mi experiencia en el Google Search Central Live MX 2025
30 septiembre, 2025