web-dev-qa-db-de.com

Warum werden Google Search Console 404-Fehler beim Crawlen meiner eigenen Website nicht angezeigt?

Ich habe eine Liste mit 404 und 403 Seiten aus der Google Search Console exportiert. Ich habe diese URLs mit dem Crawling meiner Website verglichen. Die 404-Seiten in der Google Search Console befinden sich nicht in der Liste der Crawl-Seiten meiner Website.

Heißt das, ich muss diese von GSC gesammelten Seiten nicht umleiten?

3

Diese Seiten stammen wahrscheinlich von fehlerhaften externen Links. Google crawlt sie, erhält eine 404, besucht sie jedoch gelegentlich erneut, falls sie behoben wurden.

Wenn Sie die Traffic-/Backlink-Vorteile dieser Links erhalten möchten, müssen Sie sie dennoch umleiten.

3
L Martin

Wenn Sie im Crawl-Fehlerbericht auf die URL klicken, wird ein Popup mit der Registerkarte "Verknüpft von" angezeigt. Auf dieser Registerkarte teilt Google Ihnen mit, wo der Link zu diesen Seiten gefunden wurde:

Vielleicht stellen Sie fest, dass es sich um Folgendes handelt:

  • Defekte Links auf Ihrer Website
  • Defekte Links auf Websites von Drittanbietern
  • Text-URLs, die Googlebot entdeckt hat und die nicht verlinkt sind
  • JavaScript-Teile, die Googlebot denkt möglicherweise URLs sind

Beim Crawlen Ihrer eigenen Website werden wahrscheinlich nur die defekten Links auf Ihrer eigenen Website gefunden. Da der Googlebot das gesamte Web crawlt und über Heuristiken zum Auffinden von Links verfügt, findet er mehr Fehler als das eigene Crawlen nur Ihrer Website.

Ich würde einen 404-Fehler nur beheben, wenn er sowohl Nutzer als auch Googlebot betrifft. Defekte Links von Ihrer Website sind immer eine Korrektur wert. Unterbrochene Links von Websites von Drittanbietern sind zu reparieren, wenn Sie erkennen können, auf was sie verweisen sollen. Googlebot-Dummheit beim Auswählen von Dingen, die Links aus JavaScript sein könnten, ist nur Rauschen.

Google geht davon aus, dass auf ordnungsgemäß funktionierenden Websites 404-Fehler auftreten. Tatsächlich macht sich Google Sorgen, wenn der Googlebot für keine URL einen 404-Fehler erhält, insbesondere für diejenigen, bei denen sollte Junk ist. Solange die URLs, die einen 404-Code zurückgeben, keinen Inhalt haben sollen, schaden diese 404-Fehler Ihrer Website in keiner Weise. Es ist egal, ob es 10 oder 10 Millionen von ihnen gibt.

Es gibt einige grundlegende Methoden zum Beheben von Durchforstungsfehlern:

  • Entfernen Sie den Link zur 404-Seite, falls diese sich auf Ihrer Website befindet
  • Korrigieren Sie den Link zur 404-Seite so, dass er auf das Richtige verweist
  • 301 leite die 404 URL auf die aktuelle Seite um (zB: /page.ht -> /page.html)
  • Erstellen Sie eine neue Inhaltsseite unter der Fehler-URL
2