Tag: Google

Chuck Norris…

  • Chuck Norris doesn’t write code…oh no, he thinks about the finished product and the code appears.
  • Chuck Norris has no need for virtual methods. Nothing can override Chuck Norris.
  • Chuck Norris wrote a program that calculated the last digit of pi.
  • Chuck Norris can finish an infinite loop in 1.3 seconds.
  • Chuck Norris normalizes all schema just by inserting random data
  • MVC actually stands for Model-View-ChuckNorris. Controller is just one of his nicknames.
  • A synchronize operation doesn’t protect against Chuck Norris, if he wants the object, he takes it.
  • Chuck Norris invented recursion to see what would happen if he roundhouse kicked himself.
  • Chuck Norris can multi-thread on a single processor by breaking it into pieces.
  • Chuck Norris’ compiler is afraid of displaying warnings to him. It just fixes the code automatically.
  • Chuck Norris’ first program was kill -9.

Quelle: Google Developer Central

Google Webmaster Sitemap: Gekürzte Antwort

Schon seit längerem zeigen die Google Webmaster Sitemap, unter dem Menüpunkt Crawling-Fehler, an dass bis zu 78% der BugBlog Seiten eine “Gekürzte Antwort” zurückgeben. Vor einem Monat waren es noch überwiegend “Zeitüberschreitung beim Verbindungsaufbau”, die jedoch durch die Deinstallation einer WordPress-Erweiterung, mit welcher PHP-Code direkt in einen Post geschrieben werden konnte und damit inkompatibel war zu einer Erweiterung um PHP-Code hervorzuheben, behoben wurde.

Im Access-Logfile vom Apache lässt sich das Ganze nachvollziehen. Neben der Größe muss dabei auch der Statuscode berücksichtigt werden, da bspw. Urls ohne abschließenden / einen 301 (Redirect) zurückliefern. Der Aufbau findet sich hier: http://httpd.apache.org/docs/2.2/logs.html

[PHP]
[04/Nov/2012:22:28:57 +0100] “GET /seo/bots-bots-bots/2011/05/29/ HTTP/1.1” 200 7547 “-” “Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)”
[08/Nov/2012:12:39:03 +0100] “GET /seo/bots-bots-bots/2011/05/29/ HTTP/1.1” 200 29952 “-” “Mozilla/5.0 (compatible; Infohelfer/1.3.0; +http://www.infohelfer.de/crawler.php)”
[09/Nov/2012:04:23:32 +0100] “GET /seo/bots-bots-bots/2011/05/29/ HTTP/1.1” 200 29950 “-” “Mozilla/5.0 (compatible; SISTRIX Crawler; http://crawler.sistrix.net/)”
[10/Nov/2012:20:14:27 +0100] “GET /seo/bots-bots-bots/2011/05/29/ HTTP/1.1” 200 7528 “-” “Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322; […])”
[/PHP]

Es ist erkennbar, das immer der Erfolgs-Statuscode 200 (OK) zurückgegeben wird, die Antwort jedoch zwischen 7547 und 29952 Bytes variiert. Kleinere Abweichungen sind dabei durchaus möglich, weil unterhalb der Posts verschiedene weitere relevante Posts angezeigt werden. Dies erklärt aber nicht eine Abweichung von bis zu 75% nach unten.

Google Webmaster Sitemap URL Fehler vom BugBlog

Als nächstes werde ich nochmal mit wget versuchen dem Fehler auf die Spur zu kommen, bzw. habe ich das LogLevel im Apache auf “info” gestellt und erhoffe mir dadurch weitere “sachdienliche Hinweise” ;-) Die Google Webmaster Sitemap bzw. der Menüpunkt Crawling Fehler lässt keine weiteren Rückschlüsse auf die Ursachen zu. So habe ich keine Einstellungsmöglichkeiten gefunden das Frontend auf Englisch umzustellen, um nach der Fehlermeldung besser suchen zu können, noch werden die fehlerhaften URLs aufgeführt.

WordPress SEO: Doppelte Titel – Duplicate title tags

In den Webmaster Sitemap Tools (https://www.google.com/webmasters/tools/) gibt es unter Kategorie Diagnose >> HTML Vorschläge u.a. einen Punkt, welcher sich mit doppelten Titel-Tags bzw. Duplicate title tags befasst. Bei mir waren es schon über 70 Stück, was nach einer kurzen Analyse hauptsächlich daran lag, das bei Übersichtsseiten von Tags und Kategorien die Seitenzahl nicht mit in den Titel übernommen wurde. Problem erkannt und wie folgt, in der Datei /wp-content/themes/yourTheme/header.php, gebannt:

[PHP]
Vorher:
<?php bloginfo('name'); ?> <?php if ( is_single() ) { ?><?php } ?> <?php wp_title(); ?>

Nachher:
<?php bloginfo('name'); ?> <?php if ( is_single() ) { ?><?php } ?> <?php wp_title(); ?><?php if((int)$paged>0){echo ‘ – Seite: ‘.((int)$paged);} ?>
[/PHP]

Die Seitenzahl wird nur angezeigt, sobald es mehr als eine Seite gibt. Mal schauen wie lange jetzt wieder Google braucht um die Webmasters Sitemap zu aktualisieren.

Rückblick: 5 Jahre Google Verarsche – alle Links

Zunächst möchte ich mich ganz recht herzlich bei allen Kommentatoren für ihr Feedback und ihre Anregungen bei dem seit Jahren erfolgreichsten Artikel (Google verarsche oder google verarschung) auf diesem Blog bedanken – vielen großen Dank!!!

Auf Wunsch von Nadine folgt eine Übersicht aller Links und Seiten der vergangenen fünf Jahre, die sich in meinen Kommentaren angesammelt haben, an erster Stelle natürlich der Link von Nadine:

  • http://lmgtfy.com/ :: lass mich für dich googlen
  • http://www.gidf.de/ :: Google ist Dein Freund, aber Du scheinst das nicht zu begreifen!
  • http://dsfl.2kx.de/ :: Du sollst folgendes lernen: Ich suche selber bevor ich dumme Fragen stelle.
  • http://www.missdata.org/cgi-bin/shmoogle_form.cgi :: Shmoogle – laut Focus*1: Google für Chaoten
  • http://www.guimp.com/google.html :: Miniaturversion von Google
  • http://www.google.com/technology/pigeonrank.html :: Die Technologie hinter Google
  • http://g00gl3.com/ :: Google für Microsoft Key
  • http://www.thatsloco.com/ :: Google Loco
  • http://www.ichikoo.com/joogle/ :: The search engine for jews
  • http://guugl.ch/ :: Schweizer Suchmaschine
  • http://www.schwuugle.de/ :: Schwuugle ist eine anspruchsvolle Internetsuchmaschine mit rein homosexuellen Inhalten. (aus den FAQ der Seite)
  • http://www.googoth.com/ :: Google für Goth (derzeit in Wartung)
  • “find Chuck norris” bei Google eintippen und “Auf gut Glück!” klicken :: natürlich könnte ich hier auch einen Link anbieten, aber dann wäre die Poente dahin.
  • “elgoog” bei Google eintippen und “Auf gut Glück!” klicken :: Google Spiegelverkehrt, aber aktuell wohl nicht mehr gepflegt.
  • “g00gl3” bei Google eintippen und “Auf gut Glück!” klicken :: 0|\/|G |-|4xx0|2 !!!!111
  • “toogle” bei Google eintippen und “Auf gut Glück!” klicken :: The most comprehensive image buggery on the web.
  • “soogle” bei Google eintippen und “Auf gut Glück!” klicken :: Smooth Google.
  • “noogle” bei Google eintippen und “Auf gut Glück!” klicken :: Einfach mal nonsense Surfen!
  • “gaagle” bei Google eintippen und “Auf gut Glück!” klicken :: Schweizer Version.
  • “güügle” bei Google eintippen und “Auf gut Glück!” klicken :: Die Raise a Smile Suchmaschine
  • “french military voctories” Auf gut Glück!” klicken :: Anders als erwartet.
  • “no encuentro la pagina de los cojones” bei Google eintippen und “Auf gut Glück!” klicken :: Mein Spanisch reicht bedauerlicherweise nicht aus um den Witz zu verstehen und der Google Übersetzer ist auch keine große Hilfe, vielleicht kann mich jemand in den Kommentaren mal aufklären.

Weiterführende Literatur:
http://www.pcworld.com/article/142620/googles_top_17_easter_eggs_gags_and_hoaxes.html

Aufgrund der noch immer unsicheren Haftungssituation für Blogbetreiber in Deutschland will ich die Liste nicht verlinken, um den BugBlog nicht zu gefährden.

*1: http://www.focus.de/digital/internet/surftipp-shmoogle-google-fuer-chaoten_aid_355532.html

Daneben wurden auch noch eine Reihe von weiteren Verarschungen gepostet, die ich hier natürlich nicht unterschlagen möchte, als erstes eine Aufstellung von Wikipedia Verarschungen:

  • http://kamelopedia.mormo.org
  • http://www.stupidedia.org

Außerdem gibt es auch eine eBay Verarsche:

  • http://www.i-beh.de/

und eine Google Maps

  • go to google maps click on routeplaner, Type in from Japan to China and Check out point 43

Falls es noch weitere Kommentare geben sollte, würde ich mich über einen Kommentar freuen.

Bots, Bots, Bots

Vor ziemlich genau zwei Monaten habe ich eine Webseite veröffentlicht, welche bis heute nur eine Startseite bietet. Alle weiteren Seiten sind nur über einen Login oder über einen Code erreichbar. Da sich die Webseite momentan noch in der Entwicklung befindet, bekomme ich bei 500 Error eine eMail geschickt um entsprechend reagieren zu können. Die meisten Fehler werden derzeit von Bots verursacht, die die Seite versuchen zu spidern und dabei immer wieder URLs aufrufen die nicht existieren bzw. die auch noch nie existiert haben. Es sieht so aus als würden die Bots raten. Nachfolgend ein kleiner Ausschnitt:

[PHP]
‘HTTP_FROM’ => ‘googlebot(at)googlebot.com’,
‘HTTP_USER_AGENT’ => ‘Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)’,

Fehler-URL: http://www.example.com/a
[/PHP]

[PHP]
‘HTTP_USER_AGENT’ => ‘HuaweiSymantecSpider/1.0+DSE-support@huaweisymantec.com+(compatible; MSIE 7.0; Windows NT 5.1; Trident/4.0; .NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET CLR ; http://www.huaweisymantec.com/en/IRL/spider)’,

Fehler-URL: http://www.example.com/js/+
[/PHP]

[PHP]
‘HTTP_FROM’ => ‘bingbot(at)microsoft.com’,
‘HTTP_USER_AGENT’ => ‘Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)’,

Fehler-URL: http://www.example.com/events/
Fehler-URL: http://www.example.com/news/
[/PHP]

[PHP]
‘HTTP_USER_AGENT’ => ‘Mozilla/5.0 (compatible; YandexImages/3.0; +http://yandex.com/bots)’,
‘HTTP_FROM’ => ‘support@search.yandex.ru’,

Fehler-URL: http://www.example.com/example/example-logo-new-small.jpg
[/PHP]

[PHP]
‘HTTP_USER_AGENT’ => ‘Mozilla/3.0 (compatible; Indy Library)’,

Fehler-URL: http://www.example.com/manager/html
[/PHP]

[PHP]
‘HTTP_USER_AGENT’ => ‘Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4325; .NET CLR 2.0.50727; .NET CLR 3.0.30729; .NET CLR 3.5.30707; MS-RTC LM 8)’,

Fehler-URL: http://www.example.com/groups/
[/PHP]