Respect to Google & Co.
Zur Zeit befasse ich mich beruflich sehr intensiv mit dem Thema Suchmaschinen. Damit sind nicht Suchmaschinen wie Google & Co. gemeint, sondern Suchfunktionalitäten für heterogene Informationsressouren, also unterschiedliche Datenbanken, Websites usw.
Es ist unglaublich wie kompliziert es eigentlich ist, den Suchindex ordentlich aufzubauen. Menschliche Sprache ist sehr missverständlich und kompliziert. Allein deutsche Umlaute sind ein riesiges Problem, denn sie können sowohl in deutsche Zeichen als auch internationale Zeichen normalisiert werden und müssen trotzdem gefunden werden. Das Wort “Hänger” muss z.B. sowohl als “haenger”, “hanger” und “hänger” im Index gespeichert werden. Nimmt man nun beliebige Sprachen hinzu, wird die Sache um einiges komplizierter.
Es ist wirklich unglaublich wir gut das alles bei Google funktioniert. Da steckt ordentlich Technik dahinter die ein Benutzer durch ein einfaches Textfeld bedienen kann.

