Auf dem Weg zum intelligenten Netz:
781.000.000 Ergebnisse für Sex
21. Jul 2008 08:08
 |  Immer noch die Suchmaschine: Google | Foto: dpa |
|
Eine Suchanfrage und so viele Treffer, dass man hinterher gar nichts mehr findet: Suchmaschinen sind unfassbar dumm, meint
Malte Welding. Aber zum Glück soll es ja bald das semantische Web geben.
Google-Nutzern muss das WWW manchmal wie die wahnsinnig wirre Wildnis erscheinen. Bei den meisten Blogs dürfte der Anteil der Google-Nutzer an ihren Unique Visits zwischen zehn und 50 Prozent betragen. Und die allermeisten dieser Besucher wollen ganz offensichtlich nicht das, was sie dann bekommen.
Es ist, als würden sie in einen Bus einsteigen, auf dem das Ziel der Fahrt nicht draufsteht. Wäre der städtische Nahverkehr wie der Netzverkehr, dann wären die meisten Menschen die meiste Zeit am falschen Ort. Als ich in der vergangenen Woche Texte zu dem Thema Amateurpornografie suchte, stand ich vor einem in der Natur der Sache liegenden Problem: In den Suchergebnissen dominierten die bildorientierten Angebote.Als ich dann weiter herausfinden wollte, welche Umsätze die Pornoindustrie derzeit macht, stieß Google an seine Grenzen. Zwar fand ich Angaben zu den Umsätzen des Jahres 2003, zu den Umsätzen einzelner Unternehmen oder Einnahmen von Pornostars – aber schon dafür musste ich mich endlos durch irrelevante Ergebnisse klicken. Dabei können diese Zahlen ja kein Staatsgeheimnis sein, irgendwo im Netz muss es sie geben. Allein – Google, Yahoo und Co. können sie nicht finden.
Daten im Deutungszusammenhang
Um unter anderem diesen Makel aus der Welt zu schaffen, wird seit Jahren daran gearbeitet, Daten so zu erstellen, dass Maschinen sie in einen Deutungszusammenhang setzen können.
Die Idee für diese Netz-Evolution geht auf Tim Berners-Lee, den Begründer des World Wide Web, zurück, der seine Zukunftsvision Semantisches Web taufte. Ziel ist es, Webinhalten Informationen (Metadaten) zuzuteilen, die sowohl die Bedeutung des Webinhalts (wie zum Beispiel: «Flaubert» ist ein Nachname, ist ein französischer Schriftsteller) kodieren, als auch die Beziehung zu anderen Bedeutungen («Flaubert» ist der Autor des Romans «Madame Bovary», wird oft in einer Reihe mit «Zola» und «Balzac» genannt) speichern.Zweierlei Arten von Information über Webinhalte sind also grundlegend: Solche auf einer vertikalen Achse - wie steht das Element semantisch in Beziehung zu hierarchisch über- und untergordneten Elementen? Und solche auf der horizontalen Achse - wie verhält sich seine Bedeutung zu Elementen auf gleicher Ebene (Inferenz-, Kontext- und Kombinationsregeln)?
Metadaten für Maschinen
Diese Metadaten, die den Webinhalten beigefügt werden, sind unter anderem mithilfe der beiden Sprachen «Web Ontology Language» (OWL) sowie «Resource Description Framework» (RDF) für Maschinen lesbar. Nun besteht zwar die technische Möglichkeit, dass Maschinen semantische Informationen verstehen können, allerdings sind die allermeisten Webinhalte noch nicht semantisch getaggt und somit unsichtbar für intelligente Maschinen. In Zukunft jedoch sollen Webinhalte mittels spezieller Software mit Metadaten versehen werden können.
War die Industrie zunächst noch skeptisch, da sie steigende Wartungskosten durch die zunehmende Komplexität fürchtete, forscht sie mittlerweile intensiv an der Umsetzung des semantischen Webs.Das vom Bundesministerium für Forschung und Technologie aufgesetzte Forschungsprogramm Theseus (Partner sind SAP, Siemens und Lycos) entwickelt unter anderem «Funktionen zur automatisierten Erzeugung von Metadaten für Audio-, Video-, 2D und 3D- Bilddateien und deren anwendungsspezifische Kombination, sowie Mechanismen für die semantische Verarbeitung multimedialer Dokumente und der damit verknüpften Services.»
Theseus und andere Programme
Beim Theseus-Programm wird darauf gesetzt, dass Internetnutzer beim Taggen der Webinhalte partizipieren. Das mag naiv erscheinen. Aber Luis von Ahn von der Carnegie Mellon University hat schon 2006 eine überraschende Möglichkeit entwickelt, Menschen dazu zu bringen, freiwillig Bilder zu taggen.Er hat das ESP-Game kreiert, ein Spiel, bei dem Menschen Punkte dadurch sammeln können, dass die mit einem Partner, mit dem sie nicht kommunizieren können und den sie zufällig zugeteilt bekommen haben, zusammen ein Bild mit einzelnen Worten beschreiben. Sobald sie beide dasselbe Wort benutzen, bekommen sie Punkte. Der Textechnologe Benjamin Birkenhake sagt dazu: «Tatsächlich wird das Social Tagging - wie wir es auch von Flickr und Del.icio.us kennen - als ein erster, sehr spannender Schritt auf dem Weg zum semantischen Web gesehen.»
Diesen erfreulichen Entwicklungen zum Trotz sind die beiden semantischen Suchmaschinen Exalead und Powerset (die gerade von Microsoft übernommen wird) noch recht sparsam mit ihren Ergebnislisten. Oder man muss klüger suchen, als ich es getan habe. Das würde für den zukünftigen Netzverkehr allerdings auch nicht optimistisch stimmen. Die größte Schwachstelle der Suchmaschinen ist schließlich bisher schon der dümmste anzunehmende User.
Das Netz der Dinge
Aber nicht nur um Suchmaschinen geht es beim semantischen Netz; das SemProm-Konsortium (hier sind die Partner aus der Industrie unter anderem BMW, Deutsche Post und wie bei Theseus SAP und Siemens) hat sich dem «Netz der Dinge» verschrieben. Es sollen Produkte geschaffen werden, die mit anderen Produkten, ihrer Umgebung und ihren Nutzern aktiv Informationen austauschen können.
So würde dann auch der schon sprichwörtlich gewordene Kühlschrank, der selber die Milch nachbestellt, Wirklichkeit werden. (Für mich als unregelmäßigen Milchtrinker übrigens eine Horrorvorstellung. Der Kühlschrank ersetzt dann die Mutter und sagt den typischen, anstrengenden Erzeugerinnensatz: «Aber früher mochtest du doch Milch so gerne.»)Das Netz der Dinge verspricht jedoch mehr als ungewollte Milch. Automatisierten Preisvergleich, Urlaubsbuchung durch das technische Helferlein, Abgleich von Terminen mit Kollegen, alles soll leicht und schnell gehen.
Die übernächste Web-Generation
Denkt man aber an den holprigen Weg, den Toll Collect gegangen ist, an das Missbrauchspotential (so schreiben Birkenhake und sein Kollege Eike Diestelkamp: «Dem Missbrauch semantischer Information zur Förderung des Umsatzes von zweifelhaften Waren hat auch das Semantic Web nur wenig entgegenzusetzen. Aus dem Tag-Abuse in HTML wird RDF-Abuse»), so kann das alles noch eine Weile dauern.Zeit, von der übernächsten Web-Generation zu träumen. Denn ich warte sehnsüchtig darauf, dass ich in mein Handy brüllen kann: «Wo ist mein Schlüssel?» und es antwortet mir: «In deiner Hosentasche, du Idiot.» Vermutlich aber wird es sagen: «Gestern hing er noch am Schlüsselbrett.»