Cómo Configurar tu robots.txt para IAs: Guía Práctica 2026
Cómo Configurar tu robots.txt para IAs: Guía Práctica 2026
Keyword target: "robots.txt inteligencia artificial", "bloquear GPTBot", "permitir bots IA" Idioma: ES | Palabras: ~1,200 | Tipo: How-to
TL;DR
Tu archivo robots.txt controla qué bots de IA pueden acceder a tu sitio. Si los bloqueas, las IAs no podrán citar tu contenido actualizado. Si los permites, aumentas tu visibilidad en respuestas de ChatGPT, Perplexity, Claude y Gemini.
¿Por qué importa el robots.txt para AEO?
Las IAs modernas no solo usan datos de entrenamiento. Perplexity, ChatGPT con browsing, y Google Gemini navegan la web en tiempo real para responder preguntas. Si tu robots.txt bloquea sus bots, estás invisible para el 55% de las búsquedas informacionales.
Dato clave: Un estudio de 2025 encontró que el 42% de los sitios web bloquean al menos un bot de IA sin saberlo — generalmente porque usan plantillas de robots.txt desactualizadas.
Los Bots de IA que Debes Conocer
| Bot | Empresa | Función |
|---|---|---|
| GPTBot | OpenAI | Entrena y navega para ChatGPT |
| ChatGPT-User | OpenAI | Browsing en tiempo real de ChatGPT |
| ClaudeBot | Anthropic | Navega para Claude |
| PerplexityBot | Perplexity | Búsqueda en tiempo real |
| Google-Extended | Entrena Gemini/Bard | |
| Applebot-Extended | Apple | Entrena Apple Intelligence |
| cohere-ai | Cohere | Entrenamiento de modelos |
| Bytespider | ByteDance | Entrena modelos TikTok/Douyin |
Configuración Recomendada
Opción 1: Permitir todos los bots IA (recomendado para AEO)
# Bots de IA — PERMITIDOS para máxima visibilidad
User-agent: GPTBot
Allow: /
User-agent: ChatGPT-User
Allow: /
User-agent: ClaudeBot
Allow: /
User-agent: PerplexityBot
Allow: /
User-agent: Google-Extended
Allow: /
User-agent: Applebot-Extended
Allow: /
# Bots de scraping masivo — BLOQUEADOS
User-agent: CCBot
Disallow: /
User-agent: Bytespider
Disallow: /
Opción 2: Permitir selectivamente
Si quieres controlar qué IAs acceden a tu contenido:
# Solo permitir las IAs principales
User-agent: GPTBot
Allow: /blog/
Allow: /about/
Disallow: /admin/
Disallow: /api/
User-agent: PerplexityBot
Allow: /
# Bloquear entrenamiento pero permitir browsing
User-agent: Google-Extended
Disallow: /
Opción 3: Bloquear todo (no recomendado)
# Bloquear todos los bots de IA
User-agent: GPTBot
Disallow: /
User-agent: ClaudeBot
Disallow: /
User-agent: PerplexityBot
Disallow: /
⚠️ Cuidado: Esto reduce tu visibilidad en IA pero NO impide que las IAs hablen de tu sitio — solo que no puedan acceder a tu contenido actualizado.
Browsing vs Entrenamiento: La Diferencia Clave
Algunos bots tienen dos funciones:
- GPTBot: Entrena modelos + navega en tiempo real
- ChatGPT-User: Solo browsing en tiempo real
- Google-Extended: Solo entrenamiento de Gemini
Si te preocupa que tu contenido se use para entrenar pero quieres aparecer en respuestas en tiempo real:
# Bloquear entrenamiento, permitir browsing
User-agent: GPTBot
Disallow: /
User-agent: ChatGPT-User
Allow: /
Errores Comunes
1. Usar un robots.txt de plantilla vieja
Muchos generadores de WordPress/CMS usan plantillas que no mencionan bots de IA. Resultado: se aplica la regla por defecto (User-agent: *).
2. Bloquear todo con *
User-agent: *
Disallow: /private/
Esto también bloquea a los bots de IA en /private/. Sé explícito con cada bot.
3. No tener robots.txt
Sin archivo, todos los bots acceden a todo. Parece positivo para AEO, pero pierdes control sobre qué se indexa.
Cómo Verificar tu Configuración
- Visita
tusitio.com/robots.txten el navegador - Busca menciones de GPTBot, ClaudeBot, PerplexityBot
- Si no aparecen, se rigen por las reglas generales (
User-agent: *)
Verificación automática
Herramientas como EchoSignal incluyen un audit de robots.txt en su análisis gratuito — te dicen exactamente qué bots de IA pueden acceder a tu sitio y cuáles están bloqueados.
Próximos Pasos
- Revisa tu robots.txt actual — ¿bloqueas bots de IA sin saberlo?
- Decide tu estrategia — ¿máxima visibilidad o control selectivo?
- Implementa los cambios — actualiza tu archivo y espera 24-48h
- Monitorea — pregunta a las IAs sobre tu sitio antes y después
Analiza tu robots.txt Gratis
¿Quieres saber si tu sitio está optimizado para IAs? Análisis gratuito con EchoSignal — incluye audit de robots.txt, schema y visibilidad en 4 motores de IA.
Publicado por EchoSignal | Última actualización: febrero 2026
¿Tu sitio es visible para las IAs?
Descúbrelo gratis en 30 segundos con nuestro diagnóstico automático.
Analiza tu sitio gratis →