Googlebot rastrea e indexa los primeros 15 MB de contenido HTML
En una actualización del documento de ayuda de Googlebot, Google anunció discretamente que rastrearía los primeros 15 MB de una página web. Todo lo que supere este límite no se incluirá en los cálculos de clasificación. Google especifica en el documento de ayuda: «Todos los recursos a los que se hace referencia en el HTML, como imágenes, videos, CSS y JavaScript, se obtienen por separado. Después de los primeros 15 MB del archivo, Googlebot deja de rastrear y solo considera los primeros 15 MB del archivo para rastrear. Se aplica el límite de tamaño de archivo en datos sin comprimir. esta izquierda algunos en la comunidad SEO se preguntan si eso significara que Googlebot ignoraría por completo el texto que cae debajo de las imágenes en los archivos HTML. «Es específico del archivo HTML en sí, tal como está escrito», aclaró John Mueller, defensor de la búsqueda de Google, a través de Twitter. «Los recursos/contenido incrustado extraído con etiquetas IMG no forman parte del archivo...