Wussten Sie, dass in WordPress jeder Beitrag automatisch unter mehreren URLs abgerufen werden kann? Eingebauter Duplicate Content von dem CMS, das wir gerade wegen seiner SEO-Möglichkeiten so schätzen… Zu jedem Post generiert WordPress einen Feed, so dass jeder Inhalt unter einer eigenen URLs sowie mit dem Suffix „/feed“ aufgerufen werden kann. So generiert WordPress beispielsweise zu der fiktiven Seite „meinedomain.de/meine-services“ automatisch ein weiteres Duplikat für diese Seite und nennt sie „meinedomain.de/meine-services/feed“.
Weil das automatisch geschieht machen sich wahrscheinlich viele WordPress Nutzer und SEOs darüber keine Gedanken… doch was bedeutet das für SEO? Wird schon nicht so schlimm sein…
Google erkennt die automatisch erzeugen doppelten URLs und misst ihnne nicht all zu viel Bedeutung bei… Aber es gibt ein ganz anderes Problem…
Automatische WordPress-Feeds – ein SEO-Alptraum
Der automatische Feed-Generator von WordPress (und anderen CMS) sorgt dafür, dass die Inhalte Ihrer Inhalte für Feed-Reader crawlbar werden. Nur nutzt heute kaum ein Mensch mehr Feed-Reader – oder wann haben Sie das letzte Mal einen RSS-Feed-Reader benutzt? Haben Sie überhaupt einen auf Ihrem Smartphone? Wissen Sie überhaupt noch, wofür RSS steht? Auf der Website eines reinen Bloggers, der viele Stamm-Leser hat, mag ein RSS-Feed immer noch sinnvoll sein. Aber auf einer Unternehmens-Website?
Das eigentliche SEO-Problem besteht darin, dass Feeds Spam verursachen können und so dazu beitragen können, dass Ihre Website im Ranking von Suchmaschinen herab gestuft werden kann!
Die SEO-Nachteile von Feeds
Die einzige Gruppe, die noch Feeds verwendet, sind Spammer im Internet:. Durch die Bereitstellung von Feeds auf Ihrer Website laden Sie Spam-Websites dazu ein, Ihre Inhalte einfach zu crawlen und zu stehlen. Während das Crawling einer Website einen ausgeklügelten Web-Crawler (wie den von Google) erfordert, ist das Crawlen von Feeds ein Kinderspiel, denn die Feeds basieren auf XML. Und das ist ein maschinenlesbares und standardisiertes Konzept, das genau dazu dient, Inhalte so einfach wie möglich indexierbar zu machen. Durch den zu Ihren Inhalten werden diese also maschinenlesbar.
XML hat an anderer Stelle auch weiterhin seine Daseinsberechtigung, etwa wenn es um die Erzeugung von lesbaren Daten für Schnittstellen geht, zum Beispiel für APIs. Man sollte aber tunlichst keinen XML-Feeds der eigenen Inhalte für die Crawler der Spammer bereitstellen.
Wie Spammer Ihre Inhalte mittels Feeds stehlen
Zwielichtige Spam-Suchmaschinen machten es zu ihrem Geschäftsmodell, feedbasierte Websites zu crawlen – einfach weil es so einfach ist – und daraus Webverzeichnisse zu erstellen. Wenn Ihre Website bereits seit einiger Zeit existiert und Feeds enthält, wurde sie wahrscheinlich ebenfalls schon von diesen zwielichtigen Websites indiziert. Vielleicht haben Sie Ihre Bilder und Texte bereits als Teaser auf anderen Websites gesehen, die wie Suchmaschinen, Domain-Review-Websites oder Presse-Websites aussehen. Sie alle dienen nur dem Zweck, Inhalte Dritter zu stehlen – Ihre Inhalte!
Solche Crawler ignorieren Ihre Einstellungen in der robots.txt, wie z.B. den Ausschluss von Robotern. Denn viele dieser Seiten werden in Ländern gehostet, die nicht viel mit dem Schutz geistigen Eigentums und Urheberrechten am Hut haben.
Suchen Sie einfach einmal nach einem Teil Ihrer Inhalte in Googl e und Sie werden sehen auf wie vielen Seiten Ihre Inhalte bereits zu finden sind. Das Schlimme daran: Durch die Plagiate erstellen diese Websites Duplikate – der schlimmste Alptraum aller SEOs. Viele der Seiten erstellen dazu noch Backlinks zu Ihrer Website. Da viele dieser Websites jedoch bereits von Google als Spam eingestuft wurden, schaden Ihnen diese Backlinks zusätzlich.
Wie kann man Spammer aus Feeds vermeiden?
Deaktivieren Sie die Feeds: so dass Ihr CMS/WordPress keine Feeds mehr erstellt. Da WordPress dafür jedoch keine Funktion besitzt können Sie dazu ein Plugin wie Disable Feed von Samir Shah nutzen. Damit werden alle /feed/ URLs einfach zurück zum Beitrag oder zur Seite geleitet.
Wenn die Feeds deaktiviert sind werden Spam-Bots aus Ihrer Website keinen Content mehr entwenden. Die großen Suchmaschinen dagegen können Ihre Seite auch ohne maschinenlesbare XML-Struktur interpretieren.