Eu escrevi um post para o saudoso SEO Dicas sobre como esconder conteúdo dos buscadores. E como eu disse no post, não se trata de fazer black hat, definitivamente esse não é o objetivo.
Naquele post, eu apresentei algumas dicas de como evitar que um determinado conteúdo que não se deseja indexado nas páginas de resposta de buscas, que de fato não seja indexado. As razões são diversas e você pode conferir por lá!
O que eu venho trazer aqui é um complemento: um vídeo do Matt Cutts citando algumas formas de remover conteúdo do seu site das páginas do google. Ele não passa por detalhes técnicos, mas cita algumas opções certas e erradas.
Video: Remove Your URLs from Google
Alternativas fracas para a Remoção
No vídeo, o Matt Cutts menciona que usar nofollow nos links é uma tática bem fraca e ilustra (desenhando mesmo) o por quê.
Em uma segunda opção, ele comenta que simplesmente não fazer um link para a página não resolve, pois outras pessoas podem fazer esse link. Essa é bem óbvia, mas valia mencionar.
A página pode ainda aparecer como “referrer” (o site de origem da visita a um outro site) e então o Google encontraria a página que era para ficar fora dos resultados de busca.
Alternativas médias: Robots.txt e Noindex
Ele classifica o uso do robots.txt como médio. Se não feito corretamente pode causar problemas e, ainda, as diferentes search engines podem interpretá-lo de modo diferente. O Google, em particular, não percorre o conteúdo da página, mas indica o link nas suas páginas de resposta.
Um ponto que gerou assunto foi o uso da meta tag robots com o atributo content setado para “noindex”.
Dia 24 de fevereiro, o Matt Cutts propôs uma votação para que todos expressassem a sua opinião a respeito do que deveria ser feito no uso o noindex: (1) não mostrar nada; (2) mostrar uma referência sem rastrear o conteúdo da página; ou (3) um meio termo.
O fim das contas é que o noindex segue como uma boa opção, o Google não indexa a página, mas rastreia o conteúdo.
Melhores opções: .htaccess e URL Removal Tool
Na lista de melhores opções, ele coloca como pontos fortes o uso do arquivo .htaccess e a URL Removal Tool (ferramenta de remoção de url) que fica no próprio Google Search Console.
A ideia com o .htaccess é bloquear páginas com usuário e senha. Como o Googlebot não ficaria tentando usuários e senhas até conseguir acesso, a página não seria indexada.
A URL Removal Tool é para dizer ao Google diretamente que uma URL não deve ser indexada. Atualmente ela está bem dinâmica, com a possibilidade de você bloquear e desbloquear URLs sem grandes problemas ou espera – pelo menos para o Google.com.
Update: Se você é assinante da Academia de Marketing Digital do Mestre Academy, eu tenho uma aula por lá que detalha esses conceitos, os seus resultados e mais 1 alternativa que o Matt Cutts deixou passar. Assista por lá: Remover página do Google: Robots.txt ou noindex?.
Qual é o seu método preferido para remover página do Google? É um desses? É uma outra opção? Comente abaixo!
Deixe um comentário