Category: Google

Error! – No pages are found on the rootlevel!

Stopp! Wenn Sie diese Seite über Google gefunden haben und wissen wollen wo ran es liegt dann gehen Sie zu [html]http://www.bugblog.de/typo3/typo3-no-pages-are-found-on-the-rootlevel/2006/05/28/[/html] dort finden Sie eine Antwort.

Wer kennt Sie nicht, diese tolle Fehlermeldung bei Typo3? Das Problem an solchen Fehlermeldungen ist heutzutage, dass jeder daraus gleich Rückschlüsse auf das verwendete System ziehen kann, denn schließlich wird auch sowas bei Google indiziert. Ich bestreite gar nicht, dass Fehlermeldung nicht hilfreich sind, aber kann man Sie nicht im Quelltext verstecken, denn da kommt Google bis jetzt, glaube ich, noch nicht hin.
Wie wäre es bei der obigen Fehlermeldung einfach zu schreiben: Sorry… diese Seite befindet sich leider im Aufbau. ? Das würde doch wesentlich besser rüberkommen und im Quellcode steht dann der wahre Fehlergrund. Um eine Seite in den Baustellenmodus zu versetzen, habe ich die oberste Seite einfach ausgeblendet und in den Dateien class.tslib_fe.php, zu finden unter /typo3_src/typo3/sysext/cms/tslib/, den Fehlergrund geändert und in der Datei class.t3lib_timetrack.php, im /typo3_src/t3lib/ Verzeichnis, dass Error gegen ein Sorry ausgetauscht. Sieht doch gleich viel freundlicher aus.

Man sollte einfach viel allgemeinere “Fehlermeldungen” nehmen, wie zum Beispiel “Hier entsteht eine neue Internetpräsenz” oder sowas, denn damit sind die Suchmaschinen so überflutet, dass ein Hacker schon mal länger brauchen könnte bis er die 770.000 Ergebnisse durchsucht hat.

[random_content group_id=”211″ num_posts=”1″]

Sitemap for Google

Um bei Google noch besser anzukommen, habe ich eine Sitemap gebastelt. Dazu habe ich mir von der Seite
[html]http://www.arnebrachhold.de/2005/06/05/google-sitemaps-generator-v2-final[/html]
Das Plugin heruntergeladen und per FTP in meinen Plugin Ordner verschoben. Anschließend musste ich noch 2 Dateien in mein Root Verzeichnis legen und Fertig. Bei Google Sitemap das ganze angegeben und nach wenigen Minuten wurde die Statistik aktualisiert.

Traue keinem, auch nicht Google

In einem anderen Blog sah ich letztens eine Statistik am Ende jedem Posts, die einem zeigt, ob der Googlebot schon dagewesen ist oder nicht. Das fande ich natürlich sehr cool und habe es heute auch gleich mal in meinen Blog integriert. Zu sehen ist es jetzt auf jeder Seite. Natürlich wird im Moment noch auf vielen Seiten angezeigt, das der Googlebot noch nicht da war, außer auf der Startseite, was wahrscheinlich auch daher kommt, weil ich mich heute bei Google Sitemaps angemeldet habe.
Bei der Installation habe ich mich an die Anleitung von fabriziotarizzo gehalten:
[html]http://www.fabriziotarizzo.org/wiki/Wikka/WPGooglestats[/html]

Außerdem habe ich die Seiten single.php und index.php bearbeitet, damit die Statistik auch angezeigt wird.

Folgendes habe ich in beide Dateien eingefügt:
[php]
[/php]

Die Texte “Googlebot visited this page” und “Googlebot never visited this page” habe ich direkt in der wp-googlestats.php geändert, weil es erschien mir sinnlos einen Standardwert, immer zu überschreiben.

An den Einträgen in der Datenbank kann man sehr schön erkennen, welche Seiten der Googlebot schon indiziert hat, ohne das man jetzt alle anschauen muß. Warten wir es mal ab wie schnell die Tabelle wächst. Wenn genug Einträge vorhanden sind, werde ich auch noch die Frequenz anzeigen lassen, aber im Moment macht das, denke ich, noch keine Sinn.

Google, Google und nochmals Google

Wer hätte es gedacht, Google hat wieder ein neues Tool für Webmaster herausgebracht. Es ist zwar nicht ganz so bunt und flashig wie Google Analytics aber es hat doch so seinen Reiz. Es eignet sich in meinen Augen vor allem für die Leute, die aus Sicherheitsgründen nicht den Google Analytics Code in ihre Website einfügen wollen aber dennoch gerne mehr über ihre Website erfahren würden. Bevor ich euch jetzt aber noch weiter auf die Folter spanne verrate ich es euch:
[html]https://www.google.com/webmasters/sitemaps[/html]

Nachdem ihr euch durch das ablegen einer htm Datei als Webmaster eurer Seite verifiziert habt, gibt es nette Statistiken zu sehen. Zum einen kann man sehen wann der Googlebot das letzte mal vorbeikam, außerdem hilft einem die Url seine robots.txt zu überprüfen und für andere Bots anzupassen. Aber wie bei allem so gilt auch bei der robots.txt gibt es keinen eindeutigen Standard.
[html]User-agent: Slurp
Crwal-delay: 10[/html]
Diesen Zeilen sagen dem Bot von Yahoo das er 10 Sekunden warten soll bevor er auf die nächste Seite zugreift. Der MSN Bot verhält sich in diesem Fall genauso nur den Googlebot interessiert das nicht die Bohne.
An diesem Beispiel zeigt sich sehr schnell, dass man beim Anlegen der robots.txt doch sehr aufpassen sollte. Wer jetzt erschreckt feststellt, dass sich Seiten im Suchindex von Google finden, die dort eigentlich nicht sein sollten, kann unter:
[html]http://services.google.com/urlconsole/controller[/html]
Unliebsame Seiten herauslöschen. Dieses Tool eignet sich jedoch nicht dazu, doppelten Content im Internet zu vernichten.

Für die oben genannten URLs sollte man einen GoogleMail bzw. einen GMail Account besitzen. Wer noch keinen Acc hat, kann einfach ein Kommentar mit ensprechender Bitte hinterlasse und ich werde ihm eine Einladung schicken aber nur solange der Vorrat reicht.
Da bin ich jetzt schon gespannt ob es überhaupt noch Leute gibt, die keinen Mail Account bei Google haben.

Google – elgooG

Nachdem ich meinen Blog bei Blogcounter angemeldet hatte, stellte ich fest, dass viele Leute über Google zu mir kommen. Im folgenden stellte ich fest, dass meine Seite bei den Suchwörtern “Google verarsche” die Top Position hatte. Da ich mir kaum vorstellen konnte, dass die Leute dabei meine Seite suchten, bat ich darum mir zu sagen, was sie eigentlichen erwarteten. Nach den vielen Antworten, habe ich es nun geschaffte den einen Kommentar auszuwerten.

Der folgende Link zeigt Google spiegelverkehrt
[html]http://www.alltooflat.com/geeky/elgoog/[/html]

Dieser Link basiert auf einem Wortspiel, denn diese Seite ist eine Mirror Seite. Eigentlich sind Mirror Seiten dazu gedacht, hohen Traffic abzufangen, bei dieser Seite jedoch wird Google wie in einem Spiegel – spiegelverkehrt gezeigt.