Google Penalties erkennen

8. September 2009

Der Alptraum eines jeden Seitenbetreibers ist ein plötzlicher und nicht erklärbarer Traffic Einbruch. Da die allermeisten Seiten den Großteil Ihrer Besucher von der Suchmaschine Google beziehen, kommt wohl als erstes der Gedanke an eine Google Penalty, also einer Abstrafung durch eine manuelle Seitenbewertung oder einer automatischen, algorithmischen Maßnahme. Es bleibt einem die Möglichkeit einen Reinclusion Request (Antrag zur Wiederaufnahme) zu stellen, zuvor sollten allerdings folgende Punkte geprüft werden:

Google Webmaster Tools für Hinweise und Fehlermeldungen

Die Google Webmaster Tools sind ein kostenloser Service von Google, bei dem man den Index Status und Hinweise zur Sichtbarkeit und Performance der eigenen Website kontrollieren kann. In den meisten Fällen findet man hier schon den Grund für auftretenden Probleme, seien es Warnmeldungen oder ungewöhnlich viele 404 Fehler, also nicht indexierbare Seiten.

Kürzliche, generelle Änderungen im Google Algo

In regelmäßigen Abständen führt Google Updates in seinen Bewertungskriterien durch, um Suchergebnisse relevanter und spamfreier anbieten zu können. Generell haben Seiten mit hochwertigen Inhalten und sauberen Links wenige zu Befürchten. Bei Optimierungsmethoden die sich im Graubereich oder noch dunkleren Gefilden bedienen kann ein Update schon zu extremen Einbrüchen der Besucherzahlen führen. Google versucht dabei allgemein zugängliche Quelle für selber gesetzte Links wie z.B. Artikelverzeichnisse, Kataloge, schlecht aufgebaute eigene Blognetzwerke oder nicht themenrelevanter Linktausch etc. zu identifizieren und abzuwerten. Also Links die keine klassichen Empfehlungen Dritter sind und für die Relevanz einer Seite bürgen.
Ob ein Update stattgefunden hat kann man in den gängigen SEO Blogs und Foren lesen, wie bei SEO United, im Abakus Forum oder im Google Watchblog.

Hacker Angriffe

Wer populäre Blogsysteme oder CMSe benutzt und diese nicht zeitnah updated läuft schonmal Gefahr einen Hackangriff zum Opfer zu fallen. Meist werden dabei Links versteckt, die man als normaler Besucher nicht sehen kann. Dies ist z.B. durch CSS möglich, bei dem Links in unsichtbare Container versteckt oder aus dem sichtbaren Seitenbereich rausgeschoben werden. Häufig werden Links auf Pornoseiten oder Pharma oder Glückspiel, also SPAM versteckt. Ich habe mal so eine Hackangriff auf einer Seite gehabt, allerdings hat mir Google im Webmastercentral eine freundlichen Hinweis auf dem Umstand gegeben und eine Frist zur Entfernung eingeräumt. Diese Links selber zu finden ist nur bedingt möglich, Es kann helfen den Quelltext der Index Seite auf Links zu untersuchen (Suche nach "href"), da oftmals das Template so manipuliert wird, dass die Links auf allen Seiten erscheinen.
Eigene Sitecrawler wie Xenu können alle ausgehenden Links auflisten. Bei besonders tiefen Hackerangriffen kann es Sinn machen seinen Useragent auf "GoogleBot" umzustellen, da Hacker mit einer Unterscheidung nach UserAgent die Sichtbarkeit für normale Besucher noch weiter reduzieren können.

Robot.txt

Die Robot.txt Datei in Root Verzeichnis regelt den Zugriff der Sitecrawler, also der Bots. (Ro)Bots sind die Zugriffe der Suchmaschinen zur Seitenindexierung. Hier kann ein Fehler oder gar schadhafter Hacker Angriff Seitenbereiche, Suchmaschinen oder gar die ganze Seite sperren. Ein Blick auf das Update Datum der Datei kann hier schon erste Hinweise auf eine Uhrsache für ausbleibenden Traffic sein. Ist noch keine Robots.txt Datei vorhanden, so kann man sich bei der Gelegenheit mit einem Tool im Google Webmaster Central eine passende generieren.

Backlink Profil

Prüfe, soweit wie möglich, ob es eine auffällige Veränderung in der Anzahl und Qualität der Backlinks auf die Seite gibt. Sowohl eine hohe Anzahl von verlorenen als auch hinzugewonnenen Links kann ein Grund für eine Penalty sein. Ernährt sich der Linktrust der eigenen Seite von einigen extrem starken Links, so kann ein Wegfall dieser oder eine Abstrafung der linkgebenden Seite ein Indiz für den Einbruch sein. Oftmals kann ein Redesign einer Seite Grund für das Entfernen von Links oder Verschieben von seitenweiten Links auf eine Unterseite sein. Es zahlt sich dabei aus seine wichtigsten Linkquellen regelmäßig zu beobachten.

Eigene Seitenstruktur

Wurden kürzlich Änderungen in der Struktur der eigenen Seite vorgenommen? Bedeutende Strukturänderungen führen fast immer zu eine mehr oder weniger großen Neugewichtung des Projektes oder einzelner Unterseiten. Änderungen sollten daher immer schrittweise, mit Bedacht und unter Beobachtung des Trafficverlaufes geschehen und immer revidierbar ausgelegt werden. Am besten vor jeder Änderung interne oder externe Ressourcen mit SEO Wissen zur Beratung nutzen.

Server Performance

Gab es kürzliche Änderungen am Seitenscript die nicht unbedingt sichtbar sind, allerdings negativen Einfluss auf die Prozessorbelastung des Servers haben? Damit ergeben fast automatisch längere Seitenladezeiten. Ein je nach Ausmaß noch recht kleiner, aber zunehmend immer wichtiger werdender Rankingfaktor. Auch hier Änderungen wie in der Seitenstruktur genau beobachten und eventuell zurückfahren, bzw die Serverkapazitäten anpassen. Google Webmaster Central zeigt die durchschnittliche Crawlingzeit als Graph an, so dass Fehler hier schnell sichtbar werden.

Kürzliche SEO Maßnahmen

Es sollte selbstverständlich sein, dass man bei durchgeführten SEO Maßnahmen auch immer die Effekte für eine Weile beobachtet. Bei externen Dienstleistern sollten alle Maßnahmen immer protokolliert werden, sind sie auch noch so klein.

User Generated Content kontrollieren

Vom Besucher eingestellte Inhalte (User Generated Content) bergen immer das Risiko unbemerkt schadhafte Inhalte, wie Links zu Seiten mit schlechter Reputation (Poker, Porn, Pills) oder Vokabular zu enthalten, bei dem Spam Algos Alarm schlagen. Ist man sich bei einer Seit nicht sicher ob sie zum Umfeld der sogenanten Bad Neighbourhood zählt, so kann man die Seite besuchen und selber prüfen. Faktoren sind z.B. Hinweise auf Malware (Firefox zeigt sowas automatisch beim Aufruf der URL), ein augegrauter Pagerank Balken der Hauptseite (über Pagerank Plugins sichtbar) oder prüfen auf nicht vorhandene Indexierung der Seite über Google suche nach "site:www.domain.de" (bei ganz neuen Seiten allerdings hinreichendes Argument). Oft reicht aber schon ein Blick und etwas Erfahrung um einen eventuell gefährlichen Spamfaktor der Seite festzustellen.

Dublicate Content

Google versucht zur Reinhaltung seines Indexes nur Originalquellen von Content anzuzeigen. Auch wenn man selber penibel auf handerstellte Inhalte achtet, so ist es unter Umständen doch möglich, dass sich andere Seiten ungefragt an den eigenen Inhalten bedienen. Ist dies im Grunde illegal, allerdings gibt es auch eine Reihe von Diensten, die dieses unter dem WEB 2.0 Tarnmantel als besonderen Service darzustellen. Oftmals hat man dieses sogar unbewusst selber angestoßen, z.B bei Blogverzeichnissen, die RSS Feed aggregieren. Google ist relativ gut geworden Originalquelle zu erkennen, was man auch an extrem schneller Indexierung von neuen Inhalten merk. Falls technisch möglich hilft es hier mit einem Ping neue Inhalte direkt nach Erstellung an Google zu melden.
Sehr neue und schwache Seiten, die von sehr alten und starken Seiten aggregiert werden können unter umständen hier anfällig sein. Allerdings sind solche Aggregatoren oft recht schwach bewertet, weil sie keinen dauerhaften Nutzwert für den Besucher in Googles Augen bringen und selber ständig dem Dublicate Content Problem ausgesetzt sind.
Doppelte Inhalte kann man prüfen, indem man Textpassagen in Anführungsstrichen bei Google sucht ("Teil meines hübsch formulierten Inhaltes"). Bei komplexeren Kopiermethoden mit Textveränderung kann unter Umständen Copyscape eine Hilfe zur Auffindung von doppelten Inhalten sein. Die Schädlichkeit von seiteninterne unter mehreren URLs auffindbaren Inhalten wird meiner Meinung nach in der Regel überbewertet. Meisten rankt dann eine Seite einfach höher als die andere. Das alleine ist natürlich kein Grund dies nicht zu vermeiden zu versuchen, denn unterschiedliche Inhalte sind auf jeden Fall nützlicher.

Kennt Ihr noch andere Gründe für Penalties? Habt Ihr selber mal Penalties erlebt? Wenn ja, was war der vermutliche Grund dafür?

via Daily SEO Tip

Trackback URL for this post:

http://www.lopsta.com/trackback/960

3 Responses

  1. Ich hab da mal eine Frage zu dem doppelten Content. Ich bin dabei mehrere Infoseiten über Kroatien zu erstellen. Nun habe ich über verschiedene Regionen geschrieben, jedoch immer nur eine gleiche Seite über Reiseinfos eingefügt.

    Beispiel 1 : http://www.dubrovnik-info.de/reiseinfos/index.html
    Beispiel 2: http://www.makarska-info.de/reiseinfos/index.html

    Kann sich das jetzt negativ auf die einzelnen seiten auswirken?

    Viele Grüsse Heiko

  2. Ja, ja, ist richtig.Für mich und für meine Website - (http://www.city-of-hotels.com) das Problem der Dual-Core-Inhalt war in der Tat in den letzten zeit.Sovetuyu alle ziehen an ihr möglichstes vnimanie.Danke!

  3. Auf Deine Frage, ob es noch andere Gründe gibt, beschreibt Google in den Webmastertools direkt warnend, dass man jeglichen Text, der auch als Content der Seite dient, nicht verstecken soll.

    Ein Abstrafung wäre zum Beispiel weißer Text auf weißem Grund.
    Was man nicht sehen kann, kann man nicht lesen.
    Was man nicht lesen kann, macht ja nicht wirklich Sinn.

  4. Kommentar hinzufügen

    Der Inhalt dieses Feldes wird nicht öffentlich zugänglich angezeigt. Wenn Du eine Gravatar Account hast, wird dieser verwendet.