Quando você faz SEO por um longo tempo, muitas coisas se tornam comuns. Prescreva título, descrição, alt para imagens - o que poderia ser mais óbvio? Mas, na prática, acontece que em muitos sites nem mesmo essas recomendações simples do Yandex e do Google são implementadas.
Apresentamos os resultados de um grande estudo sobre o uso de vários elementos HTML nas páginas do site. Quais elementos HTML são usados com mais frequência? Os webmasters preenchem metatags e quais? O que há com a micromarcação? Spoiler: tudo está longe de ser perfeito.
O estudo dos elementos HTML foi realizado por especialistas da AdvancedWebRanking . Analisamos 8 milhões de páginas do TOP 20 do Google em busca de 30 milhões de consultas de pesquisa. O estudo original está aqui . Análise detalhada com dados refinados - no artigo Catalin Rosu para MOZ.
Apresentamos os resultados do estudo, que serão úteis para entender as tendências atuais da otimização de páginas técnicas.
Meta tags que o Google entende
Esta seção discute as metatags listadas na lista de Ajuda do Search Console. Essas tags são reconhecidas pelo Googlebot ao digitalizar páginas.
<meta name = "description" content = "...">
Descrição é uma meta descrição do conteúdo da página. Geralmente consiste em 110-150 caracteres. Essencialmente, esta é uma anotação que permite ao mecanismo de pesquisa e ao usuário entender qual conteúdo é colocado na página.
O conteúdo da descrição geralmente é levado em consideração pelo Google ao gerar snippets nos resultados da pesquisa (mas o Yandex geralmente gera snippets a seu critério).
O estudo mostrou que 54,9% dos sites têm uma descrição completa. Em 4,7% dos sites, a metatag está registrada, mas o atributo content está vazio (ou seja, a tag está vazia). E em 0,2% dos sites, a tag é registrada sem nenhum atributo de conteúdo.
<title>
O título não é tecnicamente uma metatag, mas como está escrito na seção <head> e transmite informações sobre o conteúdo da página, também é chamado de metatag - semelhante à descrição.
De uma perspectiva de SEO, o título é crítico. Ou seja, o conteúdo do título é exibido nos resultados de pesquisa do Google e Yandex como um título de snippet. Os mecanismos de pesquisa prestam atenção ao título ao determinar a relevância de uma página.
Apesar da importância do título, ele é 78,3% completo. Curiosamente, apenas em 5,6% das páginas em que o título foi escrito, o conteúdo do título duplica completamente h1. Ou seja, a maioria dos sites ainda diferencia o h1 e o título, o que é correto do ponto de vista do SEO.
Quanto ao tamanho do título, acredita-se que não deva ter mais de 60 caracteres - aproximadamente o mesmo é exibido nos cabeçalhos dos trechos. Você pode criar um título mais longo, mas as informações mais importantes devem ser colocadas nos primeiros 50 a 60 caracteres.
Título com até 30 caracteres não é tão ruim. Por exemplo, o nome de um produto ou artigo pode ser curto. Por outro lado, você não deve deixar um espaço vazio no título, se puder ser preenchido (por exemplo, além do nome do produto, indique algum recurso - cor, tamanho, material etc.).
A otimização técnica é um trabalho longo e meticuloso. Se você não tiver tempo para isso, automatize o processo. No módulo SEO da plataforma PromoPult, você pode eliminar erros no site, aumentar o nível de otimização, usabilidade e conversão. O sistema auditará seu site em mais de 60 áreas, criará um plano de trabalho para a lista de verificação e calculará o orçamento ideal. De você - apenas a aprovação do orçamento, acesso ao site e aceitação do trabalho. De fato, para você, tudo acontece "em segundo plano".
<meta name = "robots | googlebot">
A metatag robots indica aos robôs de pesquisa se é possível indexar e seguir os links em uma página. A metatag do googlebot define as regras de rastreamento apenas para o Googlebot (para Yandex - yandexbot).
Diferentemente das diretivas de proibição no robots.txt , as regras na metatag robots são consideradas uma maneira mais confiável de impedir a indexação de páginas individuais.
A metatag de robôs é encontrada em 19,7% dos sites, googlebot - em 1,7%. Ou seja, na maioria das páginas, as regras de digitalização são definidas usando robots.txt, X-robots-tag ou não definidas.
A metatag de robôs mais popular é com os valores "index, follow". Permite indexação de página e clique. TOP 5 meta tags de robôs - no histograma.
<meta name = "viewport" content = "...">
Essa metatag informa ao navegador como exibir a página em um dispositivo móvel. A presença de uma janela de exibição indica ao Google que a página está otimizada para dispositivos móveis. Esta metatag está em 62,4% das páginas. Ou seja, 37,6% das páginas não são otimizadas para dispositivos móveis.
No contexto da transição de julho de 2019 para a indexação Mobile-First, a otimização para dispositivos móveis é muito importante. E não se trata apenas da metatag da viewport, mas também da melhoria da usabilidade em dispositivos móveis e da velocidade de carregamento da página. Realizamos pesquisas sobre esses tópicos e até agora a situação está longe de ser ideal.
Esses estudos são:
<meta charset = "...">
O atributo charset indica a codificação do documento (geralmente UTF-8) no HTML 5. Usando essa metatag, a codificação é definida em 48,8% dos sites.
Isso não significa que nenhuma codificação seja especificada em outros sites. Afinal, ele pode ser definido de outra maneira - por exemplo, a meta tag <meta http-equiv = "Tipo de conteúdo" content = "text / html; charset = utf-8">. O principal é que a codificação é indicada; caso contrário, pode haver problemas com a exibição do conteúdo da página no navegador (um conjunto de caracteres incompreensível em vez de texto legível - isso ainda acontece!).
<meta http-equiv = "atualizar" conteúdo = "...; url = ...">
Essa metatag envia o usuário para um URL diferente e é usada como um método de redirecionamento simples. Observe que ele não é suportado por todos os navegadores e pode enganar os usuários.
O W3C não recomenda o uso de redirecionamentos com metatags. A melhor opção é 301 redirecionamentos. Não é de surpreender que apenas 0,1% dos sites usem a metatag de atualização. Provavelmente, são páginas de designers desatualizados em que não há acesso ao gerenciamento no nível do servidor e a capacidade de configurar redirecionamentos 301 no painel de administração.
<meta name = "rating" content = "..." />
Essa metatag marca a página como contendo conteúdo adulto. Esta página não aparece ao usar o SafeSearch.
O Google recomenda o uso dessas metatags para conteúdo adulto:
<meta name = "rating" content = "adult" />
<meta name = "rating" content = "RTA-5042-1996-1400-1577-RTA" />
Essas metatags estão em 1,7% das páginas.
<meta name = "google" content = "nositelinkssearchbox">
Essa é uma metatag exótica usada em apenas mil sites em 8 milhões.
Às vezes, os resultados da pesquisa do Google exibem uma caixa de pesquisa no seu site. A metatag nositelinkssearchbox informa ao Google que você não precisa exibir este campo.
É difícil imaginar uma situação em que vale a pena dar ao Google essa recomendação. Portanto, não há nada de surpreendente na baixa demanda por essa metatag.
<meta name = "verificação de site do google" content = "...">
Uma maneira de verificar a propriedade do site no Google Search Console é por meio dessa metatag. É colocado em 16,6% dos sites analisados.
<meta name = "google" content = "notranslate">
Outra meta tag específica. Ele diz ao Google para não sugerir a tradução da página se o idioma do usuário for diferente do idioma da página. Essa tag usa apenas 0,1% dos sites.
Dados Estruturados (JSON-LD)
Dados estruturados são um formato padronizado para apresentar informações da página e classificar seu conteúdo.
Os dados estruturados são descritos usando Microdata, RDFa ou JSON-LD. O Google entende todos esses formatos, mas recomenda o uso de JSON-LD (na pesquisa Yandex, esse formato ainda não é suportado ).
A marcação de dados (independentemente do seu tipo) usando JSON-LD está disponível em 34,1% dos sites. Na maioria das vezes, o JSON-LD é usado para marcar uma pesquisa no site. Por esse motivo, uma sequência de pesquisa adicional para um site em um snippet pode aparecer nos resultados de pesquisa do Google. O layout de perfis sociais, logotipo, dados de empresas locais também é popular.
Leia mais sobre JSON-LD aqui . Também escrevemos sobre a configuração rápida do micro-layout de diferentes maneiras.
Atributo Rel = "canônico"
Este atributo informa ao mecanismo de pesquisa que a página em que está colocada é uma prioridade para indexação. É usado para combater páginas duplicadas que aparecem por vários motivos (versões impressas, páginas de paginação, páginas com parâmetros dinâmicos etc.). Ocorre em 40% das páginas.
meta name = "keywords"
Faz dez anos que o Google anunciou que não leva em consideração a metatag de palavras-chave ao classificar as páginas. No entanto, está 32,2% cheio. Em 3,2% das páginas, a metatag está registrada, mas possui valores vazios.
É interessante que o Yandex leve em consideração a meta tag de palavras-chave ao determinar a correspondência das páginas para pesquisar consultas. Mas agora, na maioria das vezes, não é preenchido.
Cabeçalhos h1-h6
Os cabeçalhos h1-h6 permitem estruturar seu documento. Portanto, eles são importantes para o SEO. Apesar disso, os títulos h1 são encontrados apenas em 59,6% das páginas, h2 - em 58,9%, h3 - em 49,6%.
Após coletar informações sobre todos os cabeçalhos, verificou-se que o mais popular foi h3 em termos de frequência de uso (42% do número total de cabeçalhos).
Curiosamente, o estudo encontrou 23.116 cabeçalhos h7 e até 7.276 h8 cabeçalhos. Quão justificada é a questão, porque poucas pessoas prescrevem h5-h6.
Atributo Alt
Este é um atributo da marca <img>. Indica texto alternativo para imagens. Este texto é exibido em vez da imagem se a exibição estiver desativada no navegador.
Para o SEO, o atributo alt é importante porque os mecanismos de pesquisa entendem do que se trata a imagem. Isso permite que você tome uma boa posição na busca de imagens e atraia tráfego adicional. Mas, de fato, alt é preenchido apenas em 11,9% das imagens. Em 6,4% dos casos, alt está registrado, mas com um valor vazio.
Leia sobre técnicas para otimizar imagens para pesquisa em nosso blog.
Definição de idioma
Para indicar o idioma comum da página (documento) ou palavras individuais no conteúdo, o atributo lang = "*" é usado na marcação HTML. Este atributo está presente em 65% das páginas analisadas.
O atributo hreflang = "*" é usado para indicar versões de idiomas alternativos. O Google recomenda o hreflang para designar versões localizadas de páginas. Uma recomendação semelhante é dada pelo Yandex. Este atributo é encontrado em 21,6% das páginas.
Gerenciador de tags do Google
O Gerenciador de tags do Google é um sistema de gerenciamento de tags que permite adicionar / atualizar códigos de rastreamento e outros fragmentos de código (tags) em um site ou aplicativo para celular.
Como resultado da análise dos sites, foi revelado que o fragmento * googletagmanager.com / gtm.js é de apenas 4,3% das páginas.
Atributo Rel = "nofollow"
Se o Google vir um link com o atributo rel = "nofollow", ele não o seguirá e não transmitirá o peso do link. Normalmente, esse atributo é usado em links para fontes não confiáveis e em conteúdo de publicidade.
Uma análise de 8 milhões de páginas revelou 12,8 milhões de links com o atributo rel = "nofollow". Essa é uma média de 1,6 links nofollow para uma página.
Em setembro de 2019, o Google anunciou que, além do atributo rel = "nofollow", ele reconheceria mais dois atributos:
- rel = "patrocinado" - para links de publicidade (pagos);
- rel = "ugc" - para links deixados pelos usuários do site (por exemplo, nos comentários).
Em outros casos, quando você não deseja transferir o peso da página, rel = "nofollow" ainda é usado.
Os novos atributos do webmaster começaram a ser usados um pouco: duas semanas após a notícia, foram encontrados 278 links patrocinados e 123 links ugc.
O Yandex ainda não apresentou nenhuma inovação em relação a rel = "nofollow".
Gráfico aberto do Facebook
A marcação Open Graph (protocolo) permite que o conteúdo que você compartilha nas redes sociais tenha a aparência exata de que você precisa. O protocolo foi desenvolvido para o Facebook, mas também suporta VKontakte, Pinterest, Twitter, LinkedIn, Telegram, WhatsApp, Viber, etc.
As tags mais comuns são:
- og: title - title;
- og: url - link para a página;
- og: tipo - tipo de página (artigo, notícias, vídeo, categoria, etc.);
- og: site_name - nome do site;
- og: image - link para a imagem que será exibida na postagem.
Cerca de duas vezes menos comuns são as tags og: description (descrição da página) e og: locale (localização do site - idioma).
Links de mídia social
A análise de links para redes sociais mostrou que a rede social mais popular é o Facebook. 77,3% das páginas possuem links para ele. Em segundo lugar, o Twitter (65,2%). Mas você deve entender que este é um estudo ocidental. Naturalmente, na Rússia a situação é diferente.
Curiosamente, 12,7% das páginas ainda estão vinculadas ao Google+ - apesar de essa rede social ter sido fechada em abril de 2019. Provavelmente é apenas inércia.
rel = "anterior" / "próxima"
Desde março de 2019, o Google não oferece suporte a esses atributos de navegação da página. Curiosamente, o suporte a atributos foi desativado há vários anos, mas o Google anunciou isso oficialmente apenas este ano.
Agora, em vez dos atributos rel = "prev" / "next", o Google recomenda colocar o conteúdo em uma página, em vez de dividi-lo em várias páginas.
O estudo revelou que o atributo rel = "prev" é usado em 0,3% das páginas, rel = "next" - em 3% das páginas.
Para resumir: ainda há trabalho a fazer
Entender como é a página da Web comum dá uma idéia das tendências atuais. E então surgem perguntas.
Por que os webmasters raramente prescrevem alt para imagens? Por que existem títulos h1 em apenas 60% das páginas? Por que o título e a descrição estão longe de estar completos? Por que eles não têm pressa para implementar a micro-marcação JSON-LD? Mas isso é SEO básico ...
Quero dizer que tudo isso não importa. Afinal, as páginas do TOP-20 do Google foram analisadas. Ou seja, o Google considera que eles têm autoridade na massa geral - mesmo sem altos.
Mas não esqueça que o SEO é um complexo de fatores. Consideramos apenas um pequeno aspecto técnico. Mesmo se considerarmos apenas a otimização de sites, existem mais de 60 trabalhos diferentes. E também links, menções, localização, fatores comportamentais ...
Portanto, a partir do "toque" do SEO técnico básico, seu site definitivamente não sofrerá. E se você considera que nem tudo é tão bom em outros sites, o crescimento é mais do que real.