How-to2026-03-03

Como Configurar o robots.txt para IAs: Guia Pratico 2026

Como Configurar o robots.txt para IAs: Guia Prático 2026

Palavra-chave alvo: "robots.txt inteligência artificial", "bloquear GPTBot", "permitir bots IA"
Idioma: PT | Palavras: ~1.200 | Tipo: How-to


TL;DR

O seu arquivo robots.txt controla quais bots de IA podem acessar o seu site. Se você os bloqueia, as IAs não conseguem citar seu conteúdo atualizado. Se você os permite, aumenta sua visibilidade nas respostas do ChatGPT, Perplexity, Claude e Gemini.


Por que o robots.txt Importa para o AEO?

As IAs modernas não usam apenas dados de treinamento. Perplexity, ChatGPT com browsing e o Google Gemini navegam na web em tempo real para responder perguntas. Se o seu robots.txt bloqueia os bots deles, você fica invisível para mais de 50% das buscas informacionais.

Dado importante: Um estudo de 2025 descobriu que 42% dos sites bloqueiam pelo menos um bot de IA sem saber — geralmente porque usam templates de robots.txt desatualizados.


Os Bots de IA que Você Precisa Conhecer (2026)

Bots de Recuperação (Busca em Tempo Real)

Esses bots buscam conteúdo em tempo real quando um usuário faz uma pergunta na IA. Bloqueá-los = invisível nas respostas ao vivo.

Bot Empresa Função
ChatGPT-User OpenAI Browsing em tempo real do ChatGPT
PerplexityBot Perplexity Busca em tempo real
Claude-Web Anthropic Navega para Claude (modo busca)
YouBot You.com Busca em tempo real

Bots de Treinamento (Dados de Aprendizado)

Esses bots coletam dados para treinar os modelos. Bloqueá-los afeta a visibilidade no médio-longo prazo (próximo ciclo de treinamento).

Bot Empresa Afeta qual IA
GPTBot OpenAI ChatGPT (futuro)
ClaudeBot / anthropic-ai Anthropic Claude (futuro)
Google-Extended Google Gemini (futuro)
Applebot-Extended Apple Apple Intelligence
cohere-ai Cohere Modelos Cohere
CCBot Common Crawl Dados gerais de treinamento
Bytespider ByteDance Modelos TikTok/Douyin

O Que Fazer: 3 Estratégias

Estratégia A: Máxima Visibilidade (Recomendada para a maioria)

Permita todos os bots de IA — tanto os de recuperação quanto os de treinamento. Esta é a estratégia certa para sites de conteúdo, blogs, SaaS, e-commerce e qualquer site que queira crescer em visibilidade de IA.

# robots.txt — Estratégia Visibilidade Máxima
# Atualizado: março 2026

# Bots de recuperação (tempo real)
User-agent: ChatGPT-User
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: Claude-Web
Allow: /

User-agent: YouBot
Allow: /

# Bots de treinamento
User-agent: GPTBot
Allow: /

User-agent: ClaudeBot
Allow: /

User-agent: anthropic-ai
Allow: /

User-agent: Google-Extended
Allow: /

User-agent: Applebot-Extended
Allow: /

User-agent: CCBot
Allow: /

# Padrão — tudo permitido
User-agent: *
Allow: /

Sitemap: https://seusite.com/sitemap.xml

Estratégia B: Permitir Busca, Bloquear Treinamento

Para sites que querem visibilidade nas respostas em tempo real, mas não querem que seus dados sejam usados para treinar modelos. Útil para agências, consultores e criadores de conteúdo com IP valioso.

# robots.txt — Permitir busca, bloquear treinamento

# Permitir bots de recuperação (tempo real)
User-agent: ChatGPT-User
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: Claude-Web
Allow: /

# Bloquear bots de treinamento
User-agent: GPTBot
Disallow: /

User-agent: ClaudeBot
Disallow: /

User-agent: anthropic-ai
Disallow: /

User-agent: Google-Extended
Disallow: /

User-agent: CCBot
Disallow: /

User-agent: Bytespider
Disallow: /

# Padrão
User-agent: *
Allow: /

Cuidado: Bloquear Google-Extended não afeta o Googlebot (SEO orgânico). São bots separados.


Estratégia C: Bloqueio Total (Não Recomendada)

Bloqueia todos os bots de IA. Use apenas se tiver razões jurídicas ou comerciais específicas para não aparecer em nenhuma IA.

User-agent: GPTBot
Disallow: /

User-agent: ChatGPT-User
Disallow: /

User-agent: ClaudeBot
Disallow: /

User-agent: Claude-Web
Disallow: /

User-agent: anthropic-ai
Disallow: /

User-agent: PerplexityBot
Disallow: /

User-agent: Google-Extended
Disallow: /

User-agent: Applebot-Extended
Disallow: /

User-agent: CCBot
Disallow: /

User-agent: Bytespider
Disallow: /

User-agent: cohere-ai
Disallow: /

User-agent: *
Allow: /

Como Verificar o Seu robots.txt Atual

Passo 1: Acesse seusite.com/robots.txt no navegador.

Passo 2: Procure por linhas como:

User-agent: *
Disallow: /

Isso bloqueia TODOS os bots, incluindo os de IA.

Passo 3: Verifique especificamente se GPTBot, PerplexityBot ou ClaudeBot estão na lista Disallow.

Passo 4: Teste usando o Google Search Console → Ferramenta de teste de robots.txt (insira o user-agent do bot que quer verificar).


Erros Comuns em robots.txt

Erro 1: Usar Disallow: / sem especificar o user-agent

# ❌ ERRADO — bloqueia todos os bots
User-agent: *
Disallow: /

Este erro é mais comum do que parece — frameworks como WordPress com plugins de segurança às vezes geram esse bloqueio acidentalmente.

Erro 2: Confundir GPTBot com ChatGPT-User

  • GPTBot = coleta dados para treinar futuros modelos
  • ChatGPT-User = busca conteúdo para responder perguntas AGORA

Se você bloqueia ChatGPT-User mas permite GPTBot, os usuários do ChatGPT não veem o seu conteúdo atualizado — mas ele pode aparecer em versões futuras treinadas.

Erro 3: Pensar que bloquear Google-Extended afeta o SEO

# Isso NÃO afeta seu ranking no Google Search
User-agent: Google-Extended
Disallow: /

Google-Extended coleta dados para treinar o Gemini. O Googlebot (responsável pelo SEO) é um bot completamente separado e não é afetado por esta regra.


robots.txt vs. AI Visibility: A Relação Real

Ação Efeito na visibilidade
Permitir PerplexityBot Aparece em respostas de busca do Perplexity ✅
Bloquear PerplexityBot Invisível nas buscas do Perplexity ❌
Permitir GPTBot Pode aparecer em futuros treinamentos do ChatGPT ✅
Bloquear GPTBot Sem efeito nas buscas atuais; efeito no longo prazo ⚠️
Permitir Google-Extended Melhora dados de treino do Gemini ✅
Bloquear Google-Extended Não afeta Google Search, pode afetar Gemini futuro ⚠️

Diagnóstico Completo: Além do robots.txt

O robots.txt é apenas um dos 25+ fatores que determinam sua visibilidade em IA. Para um diagnóstico completo — com pontuação por categoria, análise de schema.org, teste em 4 LLMs e plano de ação:

EchoSignal analisa o seu site em 60 segundos, sem cadastro, sem cartão de crédito.

Diagnostique sua visibilidade em IA agora


Publicado por EchoSignal | Última atualização: março de 2026

¿Tu sitio es visible para las IAs?

Descúbrelo gratis en 30 segundos con nuestro diagnóstico automático.

Analiza tu sitio gratis →