Respect to Google & Co.

Zur Zeit befasse ich mich beruflich sehr intensiv mit dem Thema Suchmaschinen. Damit sind nicht Suchmaschinen wie Google & Co. gemeint, sondern Suchfunktionalitäten für heterogene Informationsressouren, also unterschiedliche Datenbanken, Websites usw.

Es ist unglaublich wie kompliziert es eigentlich ist, den Suchindex ordentlich aufzubauen. Menschliche Sprache ist sehr missverständlich und kompliziert. Allein deutsche Umlaute sind ein riesiges Problem, denn sie können sowohl in deutsche Zeichen als auch internationale Zeichen normalisiert werden und müssen trotzdem gefunden werden. Das Wort “Hänger” muss z.B. sowohl als “haenger”, “hanger” und “hänger” im Index gespeichert werden. Nimmt man nun beliebige Sprachen hinzu, wird die Sache um einiges komplizierter.

Es ist wirklich unglaublich wir gut das alles bei Google funktioniert. Da steckt ordentlich Technik dahinter die ein Benutzer durch ein einfaches Textfeld bedienen kann.


Keine Kommentare

»

Noch keine Kommentare.

RSS-Feed für Kommentare zu diesem Artikel. TrackBack URI

Einen Kommentar hinterlassen

Top 10 Mitmacher Juli
Die Leute mit den meisten Kommentaren


Sitemap | Tag Index |Impressum | Wordpress Plugins. Auch sehr interessante Sachen gibt es im Blogging Magazin und nebenbei gern mal einen Caffe Latte.


bloggerei.de - deutsches Blogverzeichnis blogoscoop