Qué elementos HTML tienen más demanda: análisis de 8 millones de páginas desde una perspectiva SEO

Qué elementos HTML tienen más demanda: análisis de 8 millones de páginas desde una perspectiva SEO


Cuando haces SEO por mucho tiempo, muchas cosas se vuelven comunes. Prescribir título, descripción, alt para imágenes: ¿qué podría ser más obvio? Pero en la práctica, resulta que en muchos sitios ni siquiera se implementan recomendaciones tan simples de Yandex y Google.


Presentamos los resultados de un gran estudio sobre el uso de varios elementos HTML en las páginas del sitio. ¿Qué elementos HTML se usan con más frecuencia? ¿Los webmasters completan metaetiquetas y cuáles? ¿Qué hay con el micromarcado? Spoiler: todo está lejos de ser perfecto.



El estudio de elementos HTML fue realizado por especialistas de AdvancedWebRanking . Analizamos 8 millones de páginas del TOP-20 Google para 30 millones de consultas de búsqueda. El estudio original está aquí . Análisis detallado con datos refinados - en el artículo Catalin Rosu para MOZ.


Presentamos los resultados del estudio, que serán útiles para comprender las tendencias actuales en la optimización de páginas técnicas.


Metaetiquetas que Google entiende


En esta sección se analizan las metaetiquetas enumeradas en la lista de Ayuda de Search Console. Googlebot reconoce estas etiquetas al escanear páginas.


Qué elementos HTML tienen más demanda: análisis de 8 millones de páginas desde una perspectiva SEO


<meta name = "description" content = "...">


Descripción es una meta descripción del contenido de la página. Generalmente consta de 110-150 caracteres. En esencia, esta es una anotación que permite al motor de búsqueda y al usuario comprender qué contenido se coloca en la página.


Google suele tener en cuenta el contenido de la descripción al generar fragmentos en los resultados de búsqueda (pero Yandex a menudo genera fragmentos a su discreción).

El estudio mostró que el 54,9% de los sitios tienen una descripción completa. En el 4.7% de los sitios, la metaetiqueta está registrada, pero el atributo de contenido está vacío (es decir, la etiqueta está vacía). Y en el 0.2% de los sitios, la etiqueta se registra sin el atributo de contenido.


Qué elementos HTML tienen más demanda: análisis de 8 millones de páginas desde una perspectiva SEO

<título>


El título no es técnicamente una metaetiqueta, pero como está escrito en la sección <head> y transmite información sobre el contenido de la página, también se denomina metaetiqueta, similar a la descripción.


Desde una perspectiva de SEO, el título es crítico. Es decir, el contenido del título se muestra en los resultados de búsqueda de Google y Yandex como un fragmento de título. Los motores de búsqueda prestan atención al título al determinar la relevancia de una página.

A pesar de la importancia del título, está lleno en un 78,3%. Curiosamente, solo en el 5,6% de las páginas en las que está escrito el título, el contenido del título duplica completamente h1. Es decir, la mayoría de los sitios todavía hacen que h1 y el título sean diferentes, lo cual es correcto desde el punto de vista de SEO.


En cuanto a la longitud del título, se cree que no debe tener más de 60 caracteres, aproximadamente la misma cantidad se muestra en los encabezados de los fragmentos. Puede hacer un título más largo, pero luego la información más importante debe colocarse en los primeros 50-60 caracteres.


Qué elementos HTML tienen más demanda: análisis de 8 millones de páginas desde una perspectiva SEO

El título de hasta 30 caracteres no es tan malo. Por ejemplo, el nombre de un producto o artículo puede ser corto. Por otro lado, no debe dejar un espacio vacío en el título si se puede llenar (por ejemplo, además del nombre del producto, indique alguna característica: color, tamaño, material, etc.).


La optimización técnica es un trabajo largo y meticuloso. Si no tiene tiempo para esto, automatice el proceso. En el módulo SEO de la plataforma PromoPult, puede eliminar errores en el sitio, aumentar el nivel de optimización, usabilidad y conversión. El sistema auditará su sitio en más de 60 áreas, creará un plan de trabajo para la lista de verificación y calculará el presupuesto óptimo. De usted: solo la aprobación del presupuesto, el acceso al sitio y la aceptación del trabajo. De hecho, para ti, todo sucede "en segundo plano".

<meta name = "robots | googlebot">


La metaetiqueta robots le dice a los robots de búsqueda si es posible indexar y seguir enlaces en una página. La metaetiqueta googlebot define las reglas de rastreo solo para Googlebot (para Yandex - yandexbot).


A diferencia de las directivas de rechazo en robots.txt , las reglas en la metaetiqueta de robots se consideran una forma más confiable de evitar que se indexen páginas individuales.


La metaetiqueta robots se encuentra en el 19.7% de los sitios, googlebot, en un 1.7%. Es decir, en la mayoría de las páginas, las reglas de escaneo se establecen usando robots.txt, X-robots-tag o no se establecen en absoluto.


La metaetiqueta de robots más popular es con los valores "index, follow". Permite indexar páginas y hacer clic. TOP 5 metaetiquetas de robots: en el histograma.


Qué elementos HTML tienen más demanda: análisis de 8 millones de páginas desde una perspectiva SEO

<meta name = "viewport" content = "...">


Esta metaetiqueta le dice al navegador cómo mostrar la página en un dispositivo móvil. La presencia de una ventana gráfica indica a Google que la página está optimizada para dispositivos móviles. Esta metaetiqueta está en el 62.4% de las páginas. Es decir, el 37,6% de las páginas no están optimizadas para dispositivos móviles.


En el contexto de la transición de julio de 2019 a la indexación Mobile-First, la optimización para dispositivos móviles es muy importante. Y no se trata solo de la metaetiqueta de la vista, sino también de la mejora de la usabilidad móvil y la velocidad de carga de la página. Realizamos investigaciones sobre estos temas, y hasta ahora la situación está lejos de ser ideal.


Estos estudios son:



<meta charset = "...">


El atributo charset indica la codificación del documento (generalmente UTF-8) en HTML 5. Usando esta metaetiqueta, la codificación se establece en el 48.8% de los sitios.


Esto no significa que no se especifique codificación en otros sitios. Después de todo, se puede definir de otra manera, por ejemplo, la metaetiqueta <meta http-equiv = "Content-Type" content = "text / html; charset = utf-8">. Lo principal es que se indica la codificación, de lo contrario puede haber problemas al mostrar el contenido de la página en el navegador (un conjunto de caracteres incomprensible en lugar de texto legible; ¡esto todavía sucede!).


<meta http-equiv = "refresh" content = "...; url = ...">


Esta metaetiqueta envía al usuario a una URL diferente y se utiliza como un método simple de redireccionamiento. Tenga en cuenta que no es compatible con todos los navegadores y puede inducir a error a los usuarios.


W3C no recomienda usar redireccionamientos con metaetiquetas. La mejor opción son las redirecciones 301. No es sorprendente que solo el 0.1% de los sitios usen la metaetiqueta de actualización. Probablemente se trata de páginas de diseñadores obsoletos donde no hay acceso a la administración a nivel del servidor y la capacidad de configurar redireccionamientos 301 en el panel de administración.


<meta name = "rating" content = "..." />


Esta metaetiqueta marca la página como que contiene contenido para adultos. Esta página no aparece cuando se usa SafeSearch.


Google recomienda usar estas metaetiquetas para contenido para adultos:


<meta name = "rating" content = "adult" />


<meta name = "rating" content = "RTA-5042-1996-1400-1577-RTA" />


Estas metaetiquetas están en el 1.7% de las páginas.


<meta name = "google" content = "nositelinkssearchbox">


Esta es una metaetiqueta exótica que se usa en solo mil sitios de 8 millones.


Los resultados de búsqueda de Google a veces muestran un cuadro de búsqueda en su sitio. La metaetiqueta nositelinkssearchbox le dice a Google que no necesita mostrar este campo.


Es difícil imaginar una situación en la que valga la pena darle a Google tal recomendación. Por lo tanto, no hay nada sorprendente en la baja demanda de esta metaetiqueta.


<meta name = "google-site-verification" content = "...">


Una forma de verificar la propiedad del sitio en Google Search Console es a través de esta metaetiqueta. Se coloca en el 16,6% de los sitios analizados.


<meta name = "google" content = "notranslate">


Otra metaetiqueta específica. Le dice a Google que no sugiera traducir la página si el idioma del usuario es diferente del idioma de la página. Esta etiqueta usa solo el 0.1% de los sitios.


Datos estructurados (JSON-LD)


Los datos estructurados son un formato estandarizado para presentar información de la página y clasificar sus contenidos.


Los datos estructurados se describen usando Microdata, RDFa o JSON-LD. Google comprende todos estos formatos, pero recomienda usar JSON-LD (en la búsqueda de Yandex, este formato aún no es compatible ).

El marcado de datos (independientemente de su tipo) usando JSON-LD está disponible en el 34.1% de los sitios. Muy a menudo, JSON-LD se usa para marcar una búsqueda en el sitio. Debido a esto, puede aparecer una cadena de búsqueda adicional para un sitio en un fragmento en los resultados de búsqueda de Google. El diseño de perfiles sociales, logotipo, datos de negocios locales también es popular.


Qué elementos HTML tienen más demanda: análisis de 8 millones de páginas desde una perspectiva SEO

Lea más sobre JSON-LD aquí . También escribimos sobre la configuración rápida de microdiseño de diferentes maneras.


Rel = atributo "canónico"


Este atributo le dice al motor de búsqueda que la página en la que se ubica es una prioridad para la indexación. Se utiliza para combatir páginas duplicadas que aparecen por varias razones (versiones impresas, páginas de paginación, páginas con parámetros dinámicos, etc.). Ocurre en el 40% de las páginas.


meta name = "palabras clave"


Han pasado 10 años desde que Google anunció que no tiene en cuenta la metaetiqueta de palabras clave al clasificar las páginas. Sin embargo, está 32.2% lleno. En el 3.2% de las páginas, la metaetiqueta está registrada, pero tiene valores vacíos.


Es interesante que Yandex pueda tener en cuenta la metaetiqueta de palabras clave al determinar la correspondencia de las páginas para las consultas de búsqueda. Pero ahora con mayor frecuencia no está lleno.

Encabezados h1-h6


Los encabezados h1-h6 le permiten estructurar su documento. Por lo tanto, son importantes para el SEO. A pesar de esto, los encabezados h1 se encuentran solo en el 59.6% de las páginas, h2 - en un 58.9%, h3 - en un 49.6%.


Después de recopilar información sobre todos los encabezados, resultó que el más popular era h3 en términos de frecuencia de uso (42% del número total de encabezados).


Curiosamente, el estudio encontró 23.116 encabezados h7 e incluso 7.276 encabezados h8. La forma en que se justifica su uso es la pregunta, porque incluso pocas personas recetan h5-h6.


Atributo Alt


Este es un atributo de la etiqueta <img>. Indica texto alternativo para las imágenes. Este texto se muestra en lugar de la imagen si su visualización está desactivada en el navegador.


Para SEO, el atributo alt es importante porque los motores de búsqueda entienden de qué se trata la imagen. Esto le permite tomar una buena posición en la búsqueda de imágenes y atraer tráfico adicional. Pero, de hecho, alt se llena solo en el 11,9% de las imágenes. En el 6,4% de los casos, alt está registrado, pero con un valor vacío.


Qué elementos HTML tienen más demanda: análisis de 8 millones de páginas desde una perspectiva SEO

Lea sobre las técnicas para optimizar las imágenes para la búsqueda en nuestro blog.


Definición del lenguaje


Para indicar el idioma común de la página (documento) o palabras individuales en el contenido, el atributo lang = "*" se usa en el marcado HTML. Este atributo está presente en el 65% de las páginas analizadas.


El atributo hreflang = "*" se usa para indicar versiones de idioma alternativas. Google recomienda hreflang para designar versiones localizadas de páginas. Yandex da una recomendación similar. Este atributo se encuentra en el 21,6% de las páginas.


Administrador de etiquetas de Google


Google Tag Manager es un sistema de administración de etiquetas que le permite agregar / actualizar códigos de seguimiento y otros fragmentos de código (etiquetas) a un sitio web o aplicación móvil.


Como resultado del análisis de los sitios, se reveló que el fragmento * googletagmanager.com / gtm.js es solo el 4,3% de las páginas.


Atributo Rel = "nofollow"


Si Google ve un enlace con el atributo rel = "nofollow", entonces no lo sigue y no transmite el peso del enlace. Por lo general, este atributo se usa en enlaces a fuentes no confiables y en contenido publicitario.


Un análisis de 8 millones de páginas reveló 12.8 millones de enlaces con el atributo rel = "nofollow". Eso es un promedio de 1.6 enlaces nofollow a una página.


En septiembre de 2019, Google anunció que, además del atributo rel = "nofollow", reconocería dos atributos más:


  • rel = "patrocinado" - para enlaces publicitarios (pagados);
  • rel = "ugc" - para enlaces dejados por los usuarios del sitio (por ejemplo, en comentarios).

En otros casos, cuando no desea transferir el peso de la página, todavía se usa rel = "nofollow".


Los nuevos atributos del webmaster comenzaron a usarse un poco: dos semanas después de la noticia, se encontraron 278 enlaces patrocinados y 123 enlaces ugc.


Yandex aún no ha introducido ninguna innovación con respecto a rel = "nofollow".


Gráfico abierto de Facebook


El marcado de Open Graph (protocolo) permite que el contenido que comparte en las redes sociales se vea exactamente como lo necesita. El protocolo está desarrollado para Facebook, pero también es compatible con VKontakte, Pinterest, Twitter, LinkedIn, Telegram, WhatsApp, Viber, etc.


Qué elementos HTML tienen más demanda: análisis de 8 millones de páginas desde una perspectiva SEO

Las etiquetas más comunes son:


  • og: título - título;
  • og: url - enlace a la página;
  • og: tipo - tipo de página (artículo, noticias, video, categoría, etc.);
  • og: site_name - nombre del sitio;
  • og: image: enlace a la imagen que se mostrará en la publicación.

Aproximadamente 2 veces menos comunes son las etiquetas og: description (descripción de la página) y og: locale (localización del sitio - idioma).


Enlaces de redes sociales


El análisis de los enlaces a las redes sociales mostró que la red social más popular es Facebook. El 77,3% de las páginas enlazan con él. En segundo lugar está Twitter (65.2%). Pero debes entender que este es un estudio occidental. Naturalmente, en Rusia la situación es diferente.


Qué elementos HTML tienen más demanda: análisis de 8 millones de páginas desde una perspectiva SEO

Curiosamente, el 12,7% de las páginas todavía están vinculadas a Google+, a pesar de que esta red social se cerró en abril de 2019. Esto es probablemente solo inercia.


rel = "prev" / "next"


Desde marzo de 2019, Google no ha admitido estos atributos de navegación de página. Curiosamente, el soporte de atributos se deshabilitó hace varios años, pero Google lo anunció oficialmente solo este año.


Ahora, en lugar de los atributos rel = "prev" / "next", Google recomienda colocar contenido en una página, en lugar de dividirlo en varias páginas.


El estudio reveló que el atributo rel = "prev" se usa en el 0.3% de las páginas, rel = "next" - en el 3% de las páginas.


Para resumir: aún queda trabajo por hacer


Comprender cómo se ve la página web promedio da una idea de las tendencias actuales. Y luego surgen preguntas.


¿Por qué los webmasters rara vez prescriben alt para imágenes? ¿Por qué hay encabezados h1 en solo el 60% de las páginas? ¿Por qué el título y la descripción están lejos de ser completos? ¿Por qué no tienen prisa por implementar el micro-marcado JSON-LD? Pero esto es SEO básico ...


Quiero decir que todo esto no importa: después de todo, se analizaron las páginas del TOP-20 de Google. Es decir, Google considera que tienen autoridad en la masa general, incluso sin altos.


Pero no olvide que el SEO es un complejo de factores. Consideramos solo un pequeño aspecto técnico. Incluso si solo tomamos la optimización del sitio web, entonces hay más de 60 trabajos diferentes. Y también enlaces, menciones, localización, factores de comportamiento ...


Entonces, desde el "giro" del SEO técnico básico, su sitio definitivamente no sufrirá. Y si considera que no todo es tan bueno en otros sitios, entonces el crecimiento es más que real.

Source: https://habr.com/ru/post/472610/


All Articles