- Tempo estimado para leitura deste texto: 4 minutos

O Google está lançando sua terceira iteração da atualização de conteúdo útil , introduzida pela primeira vez em agosto de 2022. O objetivo principal da atualização é classificar o conteúdo como “escrito para mecanismos de pesquisa” ou “escrito para pessoas”. algoritmos proprietários de aprendizado de máquina.

O que é interessante aqui é que o Google fez um ajuste no texto da referência oficial do Conteúdo Útil (o link acima).

Em sua interação anterior , ele disse o seguinte:

O sistema de conteúdo útil da Pesquisa Google   gera um sinal usado pelos nossos sistemas automatizados de classificação para garantir melhor que as pessoas vejam conteúdo original e útil escrito por pessoas , para pessoas, nos resultados de pesquisa. Esta página explica mais sobre como o sistema funciona e o que você pode fazer para avaliar e melhorar seu conteúdo.

E agora, desde o início do lançamento da versão mais recente, este parágrafo foi reformulado para:

O sistema de conteúdo útil da Pesquisa Google   gera um sinal usado pelos nossos sistemas automatizados de classificação para garantir melhor que as pessoas vejam conteúdo original e útil criado para pessoas nos resultados da pesquisa. Esta página explica mais sobre como o sistema funciona e o que você pode fazer para avaliar e melhorar seu conteúdo.

Em outras palavras, o Google está percebendo que não pode policiar com precisão o conteúdo gerado por IA e, em vez disso, enfatiza que o conteúdo deve ser criado primeiro para as pessoas, independentemente dos meios usados ​​para criá-lo.

Detectar conteúdo de IA é difícil, provavelmente impossível

O contato de pesquisa do Google, Danny Sullivan ( @searchliaison ), passou muito tempo no X este ano respondendo às perguntas das pessoas sobre conteúdo gerado por IA. E a essência disso é que o Google aceita pessoas que usam conteúdo gerado por IA, desde que esse conteúdo tenha um toque humano.

No início deste ano, a OpenAI removeu seu classificador de IA (uma ferramenta usada para avaliar se o conteúdo é gerado por IA ou não) porque a ferramenta foi considerada de baixa precisão .

Na postagem do blog de lançamento que foi posteriormente editada, a OpenAI adicionou uma declaração dizendo:

A partir de 20 de julho de 2023, o classificador AI não estará mais disponível devido à sua baixa taxa de precisão. Estamos trabalhando para incorporar feedback e atualmente pesquisando técnicas de proveniência mais eficazes para texto, e assumimos o compromisso de desenvolver e implantar mecanismos que permitam aos usuários entender se o conteúdo de áudio ou visual é gerado por IA.

Na minha própria experiência, o problema com muitas dessas ferramentas de detecção de IA é que elas classificam o conteúdo com base no tom. Frases básicas que não foram otimizadas com prompts tendem a ser marcadas como “robóticas” e, portanto, classificadas como geradas por IA. Mas para contornar isso, você pode fazer truques de otimização imediatos, como “fazer parecer uma narrativa”, que de repente marca o conteúdo como “provavelmente escrito por um humano”.

A IA veio para ficar, e é isso

A mudança de postura do Google não é exatamente uma surpresa. Eles próprios agora investem pesadamente em IA, inclusive com seu chatbot Bard , mas também em novos recursos de pesquisa, como a Experiência Gerativa de Pesquisa , que está sendo ativamente testada em beta por meio de seus Laboratórios de Pesquisa.

Impulsionando a pesquisa com IA generativa
Imagem: Google

Embora inicialmente, após o lançamento do ChatGPT, o consenso fosse que usar o conteúdo gerado pelo ChatGPT era um “grande não, não”, a maioria das marcas agora compartilha abertamente artigos e guias sobre como usar o ChatGPT e ferramentas semelhantes para “impulsionar sua estratégia de marketing ” ou “crie planos de conteúdo acionáveis ​​rapidamente”.

É sobre “como” você usa, não “se” você usa

Um dos principais problemas dos modelos de linguagem grande é que eles inventam muitas coisas (alucinam) e, sem a supervisão humana adequada, podem fazer coisas como chamar um jogador falecido da NBA de “inútil” . Quando examinei a reescrita gerada por IA que o MSN fez para publicar aquele artigo, ficou claro como o dia que:

  • O MSN usou um LLM de baixa qualidade baseado na frase e na estrutura do artigo.
  • O MSN não tinha um ser humano para verificar o artigo (mesmo que eles dissessem que sim).

Outra coisa que vale a pena ressaltar é que o ChatGPT tem um limite de conhecimento em 2021, o que significa que se você estiver usando o ChatGPT ou ferramentas semelhantes como principal meio de escrever conteúdo, você estará reescrevendo principalmente o que já foi dito.

John Mueller (Relações de Pesquisa do Google) fez um comentário muito bom sobre isso no Reddit algumas semanas atrás:

Você está começando de um lugar ruim, na minha opinião. Um ótimo conteúdo não terá uma boa classificação automaticamente, mas fazer com que um conteúdo péssimo tenha uma boa classificação é muito mais difícil. Começar com esse tipo de âncora puxando você para baixo, em uma área onde já existe muito conteúdo razoável, talvez até ótimo, é uma receita para o fracasso.

Se você deseja que as pessoas criem links para o seu site, você precisa torná-lo digno de links e de recomendações. Se você deseja que os mecanismos de pesquisa direcionem as pessoas para você, você precisa fornecer algo que não seja igual a outros sites (e, claro, fazer muito mais do que apenas ter esse conteúdo). Por definição (estou simplificando), se você estiver usando IA para escrever seu conteúdo, ele será reformulado em outros sites.

Nenhum dos detalhes técnicos importa quando um site não tem um propósito claro, uma proposta de valor focada no que os usuários estão perdendo e que entrega. Use detalhes técnicos e pontuações para melhorar seu trabalho. Criar sites tecnicamente excelentes não vai impedi-lo, mas primeiro você precisa dessa base de propósito.

E o que quero dizer quando digo é sobre como você usa IA para gerar conteúdo para seu blog ou artigos, se é que o faz.

Um dos problemas mais comuns que eu pessoalmente notei é que muitos sites agora usam essas ferramentas de IA para reescrever artigos (como Notícias), que não fornecem nenhum valor e normalmente são reescritos de uma forma que usa um muita linguagem incoesa e hipérbole. Mesmo assim, muitos desses sites são promovidos confortavelmente por redes de distribuição como o Google News.

Tente você mesmo. Escolha qualquer notícia de tendência e veja quem está escrevendo sobre ela no Google Notícias. Retire todos os editores com os quais você está familiarizado e o que resta são fazendas de conteúdo com spam, repletas de reescritas baratas que não contribuem em nada para a narrativa mais ampla.


A única maneira de ver o problema com o conteúdo gerado por IA sendo abordado de cabeça é se o Google e outros grandes mecanismos de pesquisa fizerem parceria com OpenAI, Meta e outros grandes pioneiros do LLM para marcar estritamente as respostas padrão, de modo que, a menos que sejam editadas – sempre será ser indicativo de que o conteúdo não foi criado por um ser humano.

Não tenho certeza se é viável que algo assim aconteça. O que sei é que o fluxo de conteúdo de IA na web aumentará drasticamente nos próximos meses e anos. Isso já está acontecendo em tantos campos e nichos diferentes, e começar com essa prática é tão absurdamente simples que você pode literalmente usar o ChatGPT para ajudá-lo a construir seu “império de fazenda de conteúdo automatizado”.

Tags: