Como Configurar o robots.txt para IAs: Guia Pratico 2026
Como Configurar o robots.txt para IAs: Guia Prático 2026
Palavra-chave alvo: "robots.txt inteligência artificial", "bloquear GPTBot", "permitir bots IA"
Idioma: PT | Palavras: ~1.200 | Tipo: How-to
TL;DR
O seu arquivo robots.txt controla quais bots de IA podem acessar o seu site. Se você os bloqueia, as IAs não conseguem citar seu conteúdo atualizado. Se você os permite, aumenta sua visibilidade nas respostas do ChatGPT, Perplexity, Claude e Gemini.
Por que o robots.txt Importa para o AEO?
As IAs modernas não usam apenas dados de treinamento. Perplexity, ChatGPT com browsing e o Google Gemini navegam na web em tempo real para responder perguntas. Se o seu robots.txt bloqueia os bots deles, você fica invisível para mais de 50% das buscas informacionais.
Dado importante: Um estudo de 2025 descobriu que 42% dos sites bloqueiam pelo menos um bot de IA sem saber — geralmente porque usam templates de robots.txt desatualizados.
Os Bots de IA que Você Precisa Conhecer (2026)
Bots de Recuperação (Busca em Tempo Real)
Esses bots buscam conteúdo em tempo real quando um usuário faz uma pergunta na IA. Bloqueá-los = invisível nas respostas ao vivo.
| Bot | Empresa | Função |
|---|---|---|
| ChatGPT-User | OpenAI | Browsing em tempo real do ChatGPT |
| PerplexityBot | Perplexity | Busca em tempo real |
| Claude-Web | Anthropic | Navega para Claude (modo busca) |
| YouBot | You.com | Busca em tempo real |
Bots de Treinamento (Dados de Aprendizado)
Esses bots coletam dados para treinar os modelos. Bloqueá-los afeta a visibilidade no médio-longo prazo (próximo ciclo de treinamento).
| Bot | Empresa | Afeta qual IA |
|---|---|---|
| GPTBot | OpenAI | ChatGPT (futuro) |
| ClaudeBot / anthropic-ai | Anthropic | Claude (futuro) |
| Google-Extended | Gemini (futuro) | |
| Applebot-Extended | Apple | Apple Intelligence |
| cohere-ai | Cohere | Modelos Cohere |
| CCBot | Common Crawl | Dados gerais de treinamento |
| Bytespider | ByteDance | Modelos TikTok/Douyin |
O Que Fazer: 3 Estratégias
Estratégia A: Máxima Visibilidade (Recomendada para a maioria)
Permita todos os bots de IA — tanto os de recuperação quanto os de treinamento. Esta é a estratégia certa para sites de conteúdo, blogs, SaaS, e-commerce e qualquer site que queira crescer em visibilidade de IA.
# robots.txt — Estratégia Visibilidade Máxima
# Atualizado: março 2026
# Bots de recuperação (tempo real)
User-agent: ChatGPT-User
Allow: /
User-agent: PerplexityBot
Allow: /
User-agent: Claude-Web
Allow: /
User-agent: YouBot
Allow: /
# Bots de treinamento
User-agent: GPTBot
Allow: /
User-agent: ClaudeBot
Allow: /
User-agent: anthropic-ai
Allow: /
User-agent: Google-Extended
Allow: /
User-agent: Applebot-Extended
Allow: /
User-agent: CCBot
Allow: /
# Padrão — tudo permitido
User-agent: *
Allow: /
Sitemap: https://seusite.com/sitemap.xml
Estratégia B: Permitir Busca, Bloquear Treinamento
Para sites que querem visibilidade nas respostas em tempo real, mas não querem que seus dados sejam usados para treinar modelos. Útil para agências, consultores e criadores de conteúdo com IP valioso.
# robots.txt — Permitir busca, bloquear treinamento
# Permitir bots de recuperação (tempo real)
User-agent: ChatGPT-User
Allow: /
User-agent: PerplexityBot
Allow: /
User-agent: Claude-Web
Allow: /
# Bloquear bots de treinamento
User-agent: GPTBot
Disallow: /
User-agent: ClaudeBot
Disallow: /
User-agent: anthropic-ai
Disallow: /
User-agent: Google-Extended
Disallow: /
User-agent: CCBot
Disallow: /
User-agent: Bytespider
Disallow: /
# Padrão
User-agent: *
Allow: /
Cuidado: Bloquear Google-Extended não afeta o Googlebot (SEO orgânico). São bots separados.
Estratégia C: Bloqueio Total (Não Recomendada)
Bloqueia todos os bots de IA. Use apenas se tiver razões jurídicas ou comerciais específicas para não aparecer em nenhuma IA.
User-agent: GPTBot
Disallow: /
User-agent: ChatGPT-User
Disallow: /
User-agent: ClaudeBot
Disallow: /
User-agent: Claude-Web
Disallow: /
User-agent: anthropic-ai
Disallow: /
User-agent: PerplexityBot
Disallow: /
User-agent: Google-Extended
Disallow: /
User-agent: Applebot-Extended
Disallow: /
User-agent: CCBot
Disallow: /
User-agent: Bytespider
Disallow: /
User-agent: cohere-ai
Disallow: /
User-agent: *
Allow: /
Como Verificar o Seu robots.txt Atual
Passo 1: Acesse seusite.com/robots.txt no navegador.
Passo 2: Procure por linhas como:
User-agent: *
Disallow: /
Isso bloqueia TODOS os bots, incluindo os de IA.
Passo 3: Verifique especificamente se GPTBot, PerplexityBot ou ClaudeBot estão na lista Disallow.
Passo 4: Teste usando o Google Search Console → Ferramenta de teste de robots.txt (insira o user-agent do bot que quer verificar).
Erros Comuns em robots.txt
Erro 1: Usar Disallow: / sem especificar o user-agent
# ❌ ERRADO — bloqueia todos os bots
User-agent: *
Disallow: /
Este erro é mais comum do que parece — frameworks como WordPress com plugins de segurança às vezes geram esse bloqueio acidentalmente.
Erro 2: Confundir GPTBot com ChatGPT-User
GPTBot= coleta dados para treinar futuros modelosChatGPT-User= busca conteúdo para responder perguntas AGORA
Se você bloqueia ChatGPT-User mas permite GPTBot, os usuários do ChatGPT não veem o seu conteúdo atualizado — mas ele pode aparecer em versões futuras treinadas.
Erro 3: Pensar que bloquear Google-Extended afeta o SEO
# Isso NÃO afeta seu ranking no Google Search
User-agent: Google-Extended
Disallow: /
Google-Extended coleta dados para treinar o Gemini. O Googlebot (responsável pelo SEO) é um bot completamente separado e não é afetado por esta regra.
robots.txt vs. AI Visibility: A Relação Real
| Ação | Efeito na visibilidade |
|---|---|
| Permitir PerplexityBot | Aparece em respostas de busca do Perplexity ✅ |
| Bloquear PerplexityBot | Invisível nas buscas do Perplexity ❌ |
| Permitir GPTBot | Pode aparecer em futuros treinamentos do ChatGPT ✅ |
| Bloquear GPTBot | Sem efeito nas buscas atuais; efeito no longo prazo ⚠️ |
| Permitir Google-Extended | Melhora dados de treino do Gemini ✅ |
| Bloquear Google-Extended | Não afeta Google Search, pode afetar Gemini futuro ⚠️ |
Diagnóstico Completo: Além do robots.txt
O robots.txt é apenas um dos 25+ fatores que determinam sua visibilidade em IA. Para um diagnóstico completo — com pontuação por categoria, análise de schema.org, teste em 4 LLMs e plano de ação:
EchoSignal analisa o seu site em 60 segundos, sem cadastro, sem cartão de crédito.
→ Diagnostique sua visibilidade em IA agora
Publicado por EchoSignal | Última atualização: março de 2026
¿Tu sitio es visible para las IAs?
Descúbrelo gratis en 30 segundos con nuestro diagnóstico automático.
Analiza tu sitio gratis →