The Protocol Gap: Brasil
O novo relatório, “The Protocol Gap: Brasil”, revela que a maioria dos sites de notícias brasileiros (93%) não está tomando medidas básicas para controlar como empresas de inteligência artificial (IA) utilizam seu conteúdo. Em novembro de 2025, apenas 7,2% dos sites de notícias analisados bloqueavam pelo menos um “crawler de IA” por meio de seus arquivos robots.txt, embora 75% tivessem esse arquivo instalado.
O robots.txt é um arquivo de texto simples colocado no domínio de um site que fornece instruções para web crawlers sobre quais páginas ou seções eles podem acessar. Embora o cumprimento dessas instruções não seja legalmente obrigatório, ele é uma das poucas ferramentas gratuitas e amplamente reconhecidas disponíveis para que publishers sinalizem suas preferências em relação à coleta de dados por IA.
Os resultados mostram que o pequeno número de veículos que restringem esse acesso se concentra principalmente em empresas conhecidas como OpenAI, Google, Common Crawl, ByteDance, Amazon, Apple, Meta e Huawei. No geral, o robots.txt raramente é utilizado como uma ferramenta estratégica para sinalizar as preferências dos publishers em relação à coleta de dados por IA.
O impacto dos crawlers de IA nos modelos de negócio da mídia digital foi uma das principais questões destacadas durante as conferências CTRL+J em 2025. Os participantes defenderam a adoção de mecanismos técnicos de defesa para fortalecer o controle dos publishers e permitir que eles monetizem o acesso de bots com base em permissões mais granulares.
Produzido pelo Journalism Relay Project, pela Momentum – Journalism and Tech Task Force e pelo International Fund for Public Interest Media (IFPIM), este primeiro relatório faz parte de uma colaboração de pesquisa mais ampla que examina o acesso da IA a conteúdos jornalísticos em mercados do Sul Global, como Brasil, Indonésia e África do Sul.
O relatório inclui uma metodologia detalhada para quem desejar replicar essa pesquisa sobre robots.txt em outros países e regiões.
Texto original: https://www.ctrl-j.info/news/protocol-gap-brazil