Quels éléments HTML sont les plus demandés: analyse de 8 millions de pages d'un point de vue SEO

Quels éléments HTML sont les plus demandés: analyse de 8 millions de pages d'un point de vue SEO


Lorsque vous faites du référencement depuis longtemps, beaucoup de choses deviennent courantes. Prescrire le titre, la description, l'alt pour les images - quoi de plus évident? Mais en pratique, il s'avère que sur de nombreux sites, même de telles recommandations simples de Yandex et Google ne sont pas mises en œuvre.


Nous présentons les résultats d'une vaste étude sur l'utilisation de divers éléments HTML sur les pages du site. Quels éléments HTML sont utilisés le plus souvent? Les webmasters remplissent-ils les balises META et lesquels? Qu'y a-t-il avec le micro-marquage? Spoiler: tout est loin d'être parfait.



L'étude des éléments HTML a été réalisée par des spécialistes d' AdvancedWebRanking . Nous avons analysé 8 millions de pages du TOP-20 Google pour 30 millions de requêtes de recherche. L'étude originale est ici . Analyse détaillée avec des données raffinées - dans l' article Catalin Rosu pour MOZ.


Nous présentons les résultats de l'étude, qui seront utiles pour comprendre les tendances actuelles de l'optimisation des pages techniques.


Balises méta que Google comprend


Cette section présente les balises META répertoriées dans la liste d' aide de la Search Console. Ces balises sont reconnues par le Googlebot lors de la numérisation des pages.


Quels éléments HTML sont les plus demandés: analyse de 8 millions de pages d'un point de vue SEO


<meta name = "description" content = "...">


Description est une méta description du contenu de la page. Se compose généralement de 110 à 150 caractères. En substance, il s'agit d'une annotation qui permet au moteur de recherche et à l'utilisateur de comprendre quel contenu est placé sur la page.


Le contenu de la description est généralement pris en compte par Google lors de la génération d'extraits dans les résultats de recherche (mais Yandex génère souvent des extraits à sa discrétion).

L'étude a montré que 54,9% des sites ont une description complète. Sur 4,7% des sites, la balise META est enregistrée, mais l'attribut de contenu est vide (c'est-à-dire que la balise est vide). Et sur 0,2% des sites, le tag est enregistré sans l'attribut content du tout.


Quels éléments HTML sont les plus demandés: analyse de 8 millions de pages d'un point de vue SEO

<titre>


Le titre n'est techniquement pas une balise META, mais comme il est écrit dans la section <head> et qu'il véhicule des informations sur le contenu de la page, il est également appelé balise META - similaire à la description.


Du point de vue du référencement, le titre est essentiel. À savoir que le contenu du titre est affiché dans les résultats de recherche de Google et Yandex en tant que titre d'extrait. Les moteurs de recherche prêtent attention au titre pour déterminer la pertinence d'une page.

Malgré l'importance du titre, il est plein à 78,3%. Fait intéressant, seulement sur 5,6% des pages sur lesquelles le titre est écrit, le contenu du titre duplique complètement h1. Autrement dit, la plupart des sites rendent le h1 et le titre différents, ce qui est correct d'un point de vue SEO.


Quant à la longueur du titre, on pense qu'elle ne devrait pas dépasser 60 caractères - environ autant que ce qui est affiché dans les en-têtes des extraits. Vous pouvez faire un titre plus long, mais alors les informations les plus importantes doivent être placées dans les 50 à 60 premiers caractères.


Quels éléments HTML sont les plus demandés: analyse de 8 millions de pages d'un point de vue SEO

Le titre jusqu'à 30 caractères n'est pas si mal. Par exemple, le nom d'un produit ou d'un article peut être court. En revanche, vous ne devez pas laisser un espace vide dans le titre s'il peut être rempli (par exemple, en plus du nom du produit, indiquez une caractéristique - couleur, taille, matière, etc.).


L'optimisation technique est un travail long et minutieux. Si vous n'en avez pas le temps, automatisez le processus. Dans le module SEO de la plateforme PromoPult, vous pouvez éliminer les erreurs sur le site, augmenter le niveau de son optimisation, de sa convivialité et de sa conversion. Le système auditera votre site dans plus de 60 domaines, créera un plan de travail pour la liste de contrôle et calculera le budget optimal. De vous - uniquement l'approbation du budget, l'accès au site et l'acceptation des travaux. En fait, pour vous, tout se passe «en arrière-plan».

<meta name = "robots | googlebot">


La balise meta robots indique aux robots de recherche s'il est possible d'indexer et de suivre les liens sur une page. La balise meta googlebot définit les règles d'analyse uniquement pour Googlebot (pour Yandex - yandexbot).


Contrairement aux directives d'interdiction dans robots.txt , les règles de la balise Meta robots sont considérées comme un moyen plus fiable d'empêcher l'indexation de pages individuelles.


La balise META robots se trouve sur 19,7% des sites, googlebot - de 1,7%. Autrement dit, sur la plupart des pages, les règles d'analyse sont définies à l'aide de robots.txt, X-robots-tag ou ne sont pas définies du tout.


La balise Meta des robots les plus populaires est avec les valeurs "index, follow". Il permet l'indexation des pages et le clic. TOP 5 balises META robots - sur l'histogramme.


Quels éléments HTML sont les plus demandés: analyse de 8 millions de pages d'un point de vue SEO

<meta name = "viewport" content = "...">


Cette balise META indique au navigateur comment afficher la page sur un appareil mobile. La présence d'une fenêtre indique à Google que la page est optimisée pour les appareils mobiles. Cette balise META se trouve sur 62,4% des pages. Autrement dit, 37,6% des pages ne sont pas optimisées pour les mobiles.


Dans le cadre de la transition de juillet 2019 à l' indexation Mobile-First, l' optimisation pour mobile est très importante. Et il ne s'agit pas seulement de la balise META de la fenêtre d'affichage, mais également de l'amélioration de la convivialité mobile et de la vitesse de chargement des pages. Nous avons mené des recherches sur ces sujets et jusqu'à présent, la situation est loin d'être idéale.


Ces études sont:



<meta charset = "...">


L'attribut charset indique l'encodage du document (généralement UTF-8) en HTML 5. En utilisant cette balise META, l'encodage est défini sur 48,8% des sites.


Cela ne signifie pas qu'aucun encodage n'est spécifié sur d'autres sites. Après tout, il peut être défini d'une autre manière - par exemple, la balise meta <meta http-equiv = "Content-Type" content = "text / html; charset = utf-8">. L'essentiel est que l'encodage soit indiqué, sinon il peut y avoir des problèmes d'affichage du contenu de la page dans le navigateur (un jeu de caractères incompréhensible au lieu d'un texte lisible - cela arrive toujours!).


<meta http-equiv = "refresh" content = "...; url = ...">


Cette balise META envoie l'utilisateur vers une URL différente et est utilisée comme une méthode de redirection simple. Veuillez noter qu'il n'est pas pris en charge par tous les navigateurs et peut induire les utilisateurs en erreur.


Le W3C ne recommande pas d' utiliser des redirections avec des balises META. La meilleure option est 301 redirections. Sans surprise, seulement 0,1% des sites utilisent la balise META de rafraîchissement. Ce sont probablement des pages sur des concepteurs obsolètes où il n'y a pas d'accès à la gestion au niveau du serveur et la possibilité de configurer des redirections 301 dans le panneau d'administration.


<meta name = "rating" content = "..." />


Cette balise META marque la page comme contenant du contenu pour adultes. Cette page n'apparaît pas lors de l'utilisation de SafeSearch.


Google recommande d' utiliser ces balises META pour le contenu pour adultes:


<meta name = "rating" content = "adult" />


<meta name = "rating" content = "RTA-5042-1996-1400-1577-RTA" />


Ces balises META se trouvent sur 1,7% des pages.


<meta name = "google" content = "nositelinkssearchbox">


Il s'agit d'une balise META exotique qui n'est utilisée que sur un millier de sites sur 8 millions.


Les résultats de recherche Google affichent parfois un champ de recherche sur votre site. La balise Meta nositelinkssearchbox indique à Google que vous n'avez pas besoin d'afficher ce champ.


Il est difficile d'imaginer une situation dans laquelle cela vaut la peine de donner une telle recommandation à Google. Par conséquent, il n'y a rien de surprenant dans la faible demande pour cette balise META.


<meta name = "google-site-verification" content = "...">


Une façon de vérifier la propriété du site dans la Google Search Console consiste à utiliser cette balise Meta. Il est placé sur 16,6% des sites analysés.


<meta name = "google" content = "notranslate">


Une autre balise meta spécifique. Il dit à Google de ne pas suggérer de traduire la page si la langue de l'utilisateur est différente de la langue de la page. Cette balise n'utilise que 0,1% des sites.


Données structurées (JSON-LD)


Les données structurées sont un format normalisé pour présenter les informations de la page et classer son contenu.


Les données structurées sont décrites à l'aide de microdonnées, RDFa ou JSON-LD. Google comprend tous ces formats, mais recommande d'utiliser JSON-LD (dans la recherche Yandex, ce format n'est pas encore pris en charge ).

Le balisage de données (quel que soit son type) utilisant JSON-LD est disponible sur 34,1% des sites. Le plus souvent, JSON-LD est utilisé pour baliser une recherche de site. Pour cette raison, une chaîne de recherche supplémentaire pour un site dans un extrait peut apparaître dans les résultats de recherche Google. La mise en page des profils sociaux, du logo, des données des entreprises locales est également populaire.


Quels éléments HTML sont les plus demandés: analyse de 8 millions de pages d'un point de vue SEO

En savoir plus sur JSON-LD ici . Nous avons également écrit sur la configuration rapide de la micro-disposition de différentes manières.


Rel = attribut "canonique"


Cet attribut indique au moteur de recherche que la page sur laquelle il est placé est une priorité pour l'indexation. Il est utilisé pour lutter contre les pages en double qui apparaissent pour diverses raisons (versions imprimées, pages de pagination, pages avec paramètres dynamiques, etc.). Se produit sur 40% des pages.


meta name = "mots-clés"


Cela fait 10 ans que Google a annoncé qu'il ne prend pas en compte la balise Meta des mots clés lors du classement des pages. Cependant, il est plein à 32,2%. Sur 3,2% des pages, la balise META est enregistrée, mais a des valeurs vides.


Il est intéressant que Yandex puisse prendre en compte la balise Meta des mots clés lors de la détermination de la correspondance des pages avec les requêtes de recherche. Mais maintenant, il n'est le plus souvent pas rempli.

En-têtes h1-h6


Les en-têtes h1-h6 vous permettent de structurer votre document. Par conséquent, ils sont importants pour le référencement. Malgré cela, les en-têtes h1 ne se trouvent que sur 59,6% des pages, h2 - de 58,9%, h3 - de 49,6%.


Après avoir collecté des informations sur tous les en-têtes, il s'est avéré que le plus populaire était h3 en termes de fréquence d'utilisation (42% du nombre total d'en-têtes).


Fait intéressant, l'étude a trouvé 23 116 en-têtes h7 et même 7 276 en-têtes h8. La justification de leur utilisation est la question, car même peu de gens prescrivent h5-h6.


Attribut Alt


Il s'agit d'un attribut de la balise <img>. Il indique un texte alternatif pour les images. Ce texte s'affiche à la place de l'image si son affichage est désactivé dans le navigateur.


Pour le référencement, l'attribut alt est important car les moteurs de recherche comprennent ce qu'est l'image. Cela vous permet de prendre une bonne position dans la recherche d'images et d'attirer du trafic supplémentaire. Mais en fait, alt n'est rempli que dans 11,9% des images. Dans 6,4% des cas, alt est enregistré, mais avec une valeur vide.


Quels éléments HTML sont les plus demandés: analyse de 8 millions de pages d'un point de vue SEO

Découvrez les techniques d'optimisation des images à rechercher sur notre blog.


Définition du langage


Pour indiquer la langue courante de la page (document) ou des mots individuels dans le contenu, l'attribut lang = "*" est utilisé dans le balisage HTML. Cet attribut est présent sur 65% des pages analysées.


L'attribut hreflang = "*" est utilisé pour indiquer des versions linguistiques alternatives. Google recommande hreflang pour désigner les versions localisées des pages. Une recommandation similaire est donnée par Yandex. Cet attribut se retrouve sur 21,6% des pages.


Gestionnaire de balises Google


Google Tag Manager est un système de gestion des balises qui vous permet d'ajouter / mettre à jour des codes de suivi et d'autres fragments de code (balises) sur un site Web ou une application mobile.


À la suite de l'analyse des sites, il a été révélé que le fragment * googletagmanager.com / gtm.js ne représente que 4,3% des pages.


Rel = attribut "nofollow"


Si Google voit un lien avec l'attribut rel = "nofollow", il ne le suit pas et ne transmet pas le poids du lien. En règle générale, cet attribut est utilisé dans les liens vers des sources non fiables et dans le contenu publicitaire.


Une analyse de 8 millions de pages a révélé 12,8 millions de liens avec l'attribut rel = "nofollow". Cela représente en moyenne 1,6 lien nofollow vers une page.


En septembre 2019, Google a annoncé qu'en plus de l'attribut rel = "nofollow", il reconnaîtrait deux autres attributs:


  • rel = "sponsorisé" - pour les liens publicitaires (payants);
  • rel = "ugc" - pour les liens laissés par les utilisateurs du site (par exemple, dans les commentaires).

Dans d'autres cas, lorsque vous ne souhaitez pas transférer le poids de la page, rel = "nofollow" est toujours utilisé.


Les nouveaux attributs du webmaster ont commencé à être un peu utilisés: deux semaines après la nouvelle, 278 liens sponsorisés et 123 liens ugc ont été trouvés.


Yandex n'a pas encore introduit d'innovations concernant rel = "nofollow".


Facebook Open Graph


Le balisage Open Graph (protocole) permet au contenu que vous partagez sur les réseaux sociaux de ressembler exactement à ce dont vous avez besoin. Le protocole est développé pour Facebook, mais il prend également en charge VKontakte, Pinterest, Twitter, LinkedIn, Telegram, WhatsApp, Viber, etc.


Quels éléments HTML sont les plus demandés: analyse de 8 millions de pages d'un point de vue SEO

Les balises les plus courantes sont:


  • og: titre - titre;
  • og: url - lien vers la page;
  • og: type - type de page (article, actualité, vidéo, catégorie, etc.);
  • og: site_name - nom du site;
  • og: image - lien vers l'image qui sera affichée dans le message.

Les balises og: description (description de la page) et og: locale (localisation du site - langue) sont environ 2 fois moins courantes.


Liens sur les réseaux sociaux


L'analyse des liens vers les réseaux sociaux a montré que le réseau social le plus populaire est Facebook. 77,3% des pages y renvoient. Twitter arrive en deuxième position (65,2%). Mais vous devez comprendre qu'il s'agit d'une étude occidentale. Naturellement, en Russie, la situation est différente.


Quels éléments HTML sont les plus demandés: analyse de 8 millions de pages d'un point de vue SEO

Fait intéressant, 12,7% des pages sont toujours liées à Google+ - malgré la fermeture de ce réseau social en avril 2019. C'est probablement juste de l'inertie.


rel = "prev" / "next"


Depuis mars 2019, Google ne prend pas en charge ces attributs de navigation de page. Fait intéressant, la prise en charge des attributs a été désactivée en fait il y a plusieurs années, mais Google n'a officiellement annoncé cela que cette année.


Maintenant, au lieu des attributs rel = "prev" / "next", Google recommande de placer le contenu sur une seule page, plutôt que de le diviser en plusieurs pages.


L'étude a révélé que l'attribut rel = "prev" est utilisé sur 0,3% des pages, rel = "next" - sur 3% des pages.


Pour résumer: il y a encore du travail à faire


Comprendre à quoi ressemble une page Web moyenne donne une idée des tendances actuelles. Et puis des questions se posent.


Pourquoi les webmasters prescrivent-ils rarement alt pour les images? Pourquoi y a-t-il des en-têtes h1 sur seulement 60% des pages? Pourquoi le titre et la description sont-ils loin d'être complets? Pourquoi ne sont-ils pas pressés de mettre en œuvre le micro-balisage JSON-LD? Mais c'est du SEO basique ...


Je tiens à dire que tout cela n'a pas d'importance - après tout, les pages du TOP 20 de Google ont été analysées. Autrement dit, Google les considère comme faisant autorité dans la masse générale - même sans altos.


Mais n'oubliez pas que le référencement est un complexe de facteurs. Nous n'avons considéré qu'un petit aspect technique. Même si nous ne prenons que l'optimisation de sites Web, il existe plus de 60 œuvres différentes. Et aussi liens, mentions, localisation, facteurs comportementaux ...


Ainsi, de la "torsion" du référencement technique de base, votre site ne souffrira certainement pas. Et si vous considérez que tout n'est pas si bon sur d'autres sites, alors la croissance est plus que réelle.

Source: https://habr.com/ru/post/fr472610/


All Articles