Googlebot rastrea e indexa los primeros 15 MB de contenido HTML


En una actualización del documento de ayuda de Googlebot, Google anunció discretamente que rastrearía los primeros 15 MB de una página web. Todo lo que supere este límite no se incluirá en los cálculos de clasificación.

Google especifica en el documento de ayuda:

«Todos los recursos a los que se hace referencia en el HTML, como imágenes, videos, CSS y JavaScript, se obtienen por separado. Después de los primeros 15 MB del archivo, Googlebot deja de rastrear y solo considera los primeros 15 MB del archivo para rastrear. Se aplica el límite de tamaño de archivo en datos sin comprimir.

esta izquierda algunos en la comunidad SEO se preguntan si eso significara que Googlebot ignoraría por completo el texto que cae debajo de las imágenes en los archivos HTML.

«Es específico del archivo HTML en sí, tal como está escrito», aclaró John Mueller, defensor de la búsqueda de Google, a través de Twitter. «Los recursos/contenido incrustado extraído con etiquetas IMG no forman parte del archivo HTML».

Lo que esto significa para el SEO

Para asegurarse de que Googlebot lo pondere, el contenido importante ahora debe incluirse en la parte superior de las páginas web. Esto significa que el código debe estar estructurado para colocar la información relevante para SEO con los primeros 15 MB en un archivo de texto o HTML compatible.

Esto también significa que las imágenes y los videos deben comprimirse y no codificarse directamente en código HTML, siempre que sea posible.

Las mejores prácticas de SEO actualmente recomiendan mantener las páginas HTML en 100 KB o menos, por lo que muchos sitios no se verán afectados por este cambio. El tamaño de la página se puede verificar con una variedad de herramientas, incluido Google Page Speed ​​​​Insights.

En teoría, podría sonar preocupante que podría tener contenido en una página que no se usa para la indexación. Sin embargo, en la práctica, 15 MB es una cantidad considerable de HTML.

Como indica Google, los activos como imágenes y videos se obtienen por separado. Según la redacción de Google, parece que este umbral de 15 MB solo se aplica a HTML.

Sería difícil romper este límite con HTML a menos que publicara el texto de libros completos en una sola página.

Si tiene páginas que superan los 15 MB de HTML, es probable que tenga problemas subyacentes que deban solucionarse de todos modos.


La fuente: Centro de búsqueda de Google
Imagen destacada: SNEHIT PHOTO/Shutterstock

if( sopp != 'yes' && addtl_consent != '1~' ){

!function(f,b,e,v,n,t,s) {if(f.fbq)return;n=f.fbq=function(){n.callMethod? n.callMethod.apply(n,arguments):n.queue.push(arguments)}; if(!f._fbq)f._fbq=n;n.push=n;n.loaded=!0;n.version='2.0'; n.queue=[];t=b.createElement(e);t.async=!0; t.src=v;s=b.getElementsByTagName(e)[0]; s.parentNode.insertBefore(t,s)}(window,document,'script', 'https://connect.facebook.net/en_US/fbevents.js');

if( typeof sopp !== "undefined" && sopp === 'yes' ){ fbq('dataProcessingOptions', ['LDU'], 1, 1000); }else{ fbq('dataProcessingOptions', []); }

fbq('init', '1321385257908563');

fbq('track', 'PageView');

fbq('trackSingle', '1321385257908563', 'ViewContent', { content_name: 'googlebot-crawls-indexes-first-15-mb-html-content', content_category: 'news seo' }); }

La entrada Googlebot rastrea e indexa los primeros 15 MB de contenido HTML se publicó primero en Seo Con SEM.



source https://seoconsem.es/2022/06/24/googlebot-rastrea-e-indexa-los-primeros-15-mb-de-contenido-html/

Comentarios

Entradas populares de este blog

Google responde por qué todo el Top 10 es contenido «robado»

Texas Locksmiths

Car Key Locksmith