Am Dienstag, den 28. Juni 2022, veröffentlichte Google ein Dokumentationsupdate zum Googlebot, das klarstellt, dass der Googlebot beim Abrufen bestimmter Dateitypen nur die ersten 15 Megabyte „sehen“ kann. Diese Einschränkung gibt es schon seit Jahren, wurde aber erst kürzlich in die Dokumentation aufgenommen, um denjenigen beim Debuggen zu helfen. Beachten Sie, dass diese Einschränkung nur für die ursprüngliche Anfrage des Googlebot gilt, nicht für Ressourcen, auf die auf der Seite verwiesen wird (z. B. wenn eine HTML-Seite auf eine JavaScript-Datei verweist, kann der Googlebot die JavaScript-Datei weiterhin anzeigen und abrufen). Es ist wahrscheinlich, dass das neue 15-MB-Limit des Googlebot keine großen Auswirkungen haben wird, da nur wenige Seiten im Internet größer sind. Wenn Sie jedoch HTML-Seiten mit mehr als 15 MB haben, können Sie versuchen, einige Inline-Skripte und CSS in externe Dateien zu verschieben. Inhalte nach den ersten 15 MB werden vom Googlebot entfernt und nur die ersten 15 MB werden an den Index weitergeleitet. Dies gilt für Abrufe durch den Googlebot (Googlebot-Smartphone und Googlebot-Desktop), wenn Dateitypen abgerufen werden, die von der Google-Suche unterstützt werden. Gewohnheit. Der Googlebot ruft Videos und Bilder ab, auf die in HTML mithilfe von URLs verwiesen wird (z. B. <img src="https://example.com/images/puppy.jpg" alt="Süßer Welpe sieht enttäuscht aus" />
ist von der kontinuierlichen Extraktion getrennt. Ja. Die Verwendung von Daten-URI{rel="nofollow"} erhöht die Größe von HTML-Dateien, da sie sich in HTML-Dateien befinden. Es gibt viele Möglichkeiten, aber wahrscheinlich ist die einfachste die Verwendung Ihres eigenen Browsers und seiner Entwicklertools. Laden Sie die Seite wie gewohnt, starten Sie dann die Entwicklertools und wechseln Sie zur Registerkarte Netzwerk. Laden Sie die Seite neu und Sie sollten alle Anforderungen sehen, die der Browser zum Rendern der Seite stellen muss. Die oberste Anforderung ist das, wonach Sie suchen, und die Größe der Seite in Byte steht in der Spalte Größe. In Chrome Developer Tools{rel="nofollow"} könnte es beispielsweise so aussehen, mit 150 KB in der Größenspalte: if you want To Überprüfen Sie, wie viele Daten der Googlebot beim Crawlen Ihrer Website heruntergeladen hat. Sie können die Registerkarte „Netzwerk“ in den Chrome-Entwicklertools verwenden oder cURL von der Befehlszeile aus verwenden. Um cURL zu verwenden, geben Sie den folgenden Code ein: curl \ -A "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36" \ -so /dev / null https://example.com/puppies.html -w '%{size_download}' Ersetzen Sie "https://example.com/puppies.html" durch die URL der Seite, die Sie überprüfen möchten. Wenn Sie weitere Fragen zu diesem Vorgang haben, finden Sie weitere Informationen auf Twitter und im Suchcenter-Forum. Sie können auch Feedback auf der Dokumentationsseite hinterlassen, wenn Sie weitere Erläuterungen benötigen.