So sprechen Sie bestimmte Crawler an
Die Robots.txt-Datei ist nach einem bestimmten Schema aufgebaut. Zuerst gibt man an, für welchen Suchmaschinen-Spider die Anweisungen gelten, danach folgen die einzelnen Anweisungen. Ein Beispiel:
# robots.txt fuer http://www.ihreseite.de/
User-agent: BeispielRobot
Disallow: /temp/ # Die Dateien sind sehr kurzlebig
Disallow: /logfiles/ # Dateien sind nicht öffentlich
Mit "User-agent: BeispielRobot" bestimmt man, dass die Anweisungen nur für den Suchmaschinen-Spider „BeispielRobot" gelten. Mit den einzelnen „Disallow"-Einträgen bestimmt man Dateien und Verzeichnisse, die nicht indexiert werden sollen. # markiert einen Kommentar und wird von den Robots ignoriert.
Wenn man auf einen Rutsch alle Crawler ausschließen will, benutzt man den sogenannten Wildchar *, also:
# Alle Robots ausschließen
User-agent: *
Disallow: /temp/
Wenn man nicht gleich alle Crawler, sondern nur ein paar bestimmte meint, kann man diese so angeben:
User-agent: Name des Spiders
Um seine Site ganz von der Indexierung auszuschließen, kann man Folgendes benutzen:
# Ganze Site für alle Robots sperren
User-agent: *
Disallow: /
Wenn man den Slash (/) weglässt, wird alles für die Indexierung freigegeben. Insofern sollten Sie in jedem Fall prüfen, ob ein mögliches Rankingproblem nicht lediglich durch eine falsch konfigurierte Robots.txt-Datei entsteht.
O.D. Dawage am 08.02.2009
Grundlagen!!!
Ist es denn so schwer, den Titel zu interpretieren?
Da steht "Grundlagen" und nicht geheime "Blackhat-Tricks - exklusiv in der IWB"...
remblog.de am 06.02.2009
SEO-Experten?
Das man kein HTML mehr verwendet, ist schon bei allen angekommen.
Wenn keine neuen Tipps kommen würde ich die Serie einstampfen. Ist Zeitverschwendung für den Redakteur und den Leser.
Es kann natürlich sein das INW eine andere Zielgruppe damit ansprechen will. SEO-Experten erreicht Ihr damit nicht.
Grüße
remblog.de