netzeitung.deOpen Content macht Google Konkurrenz

 Herausgeber: netzeitung.de

Yahoo will mit Partnern zusammen Bücher einscannen. Das Projekt macht Google Konkurrenz, will zugleich aber viel mehr.

Von Matthias Spielkamp

Die Google-Gründer Larry Page und Sergey Brin bezeichneten das Buch-Digitalisierungsprojekt ihres Unternehmens vor knapp einem Jahr als die Erfüllung eines Traumes. Seitdem hat Google tausende Werke gescannt, zugleich aber Kritik von Autoren auf sich gezogen, die eine Verletzung ihrer Urheberrechte fürchten.

Nun bekommt Google auch noch Konkurrenz. Unter dem Namen «Open Content Alliance» wollen mehrere Unternehmen und nicht-kommerzielle Organisationen Bücher und andere Medien digitalisieren, damit sie ebenfalls über das Internet durchsucht und abgerufen werden können. Das Projekt, das vom Internet Archive und Yahoo konzipiert wurde, erinnert auf den ersten Blick an Googles Projekt, unterscheidet sich aber in den Details erheblich.

So will die Open Content Alliance (OCA) zum einen hauptsächlich Bücher scannen, die gemeinfrei sind, deren Urheberrechtsschutz also bereits ausgelaufen ist. Da das in den meisten Ländern erst siebzig Jahre nach dem Tod des Autors der Fall ist, werden im OCA-Archiv vor allem Klassikertexte zu finden sein.

Im Gegensatz zu Googles Projekt müssen alle Beteiligten, die Inhalte zur Verfügung stellen, versichern, dass sie von den Rechteinhabern die Erlaubnis dazu haben. Darüber hinaus können die Rechteinhaber der Nutzung einzelner Werke zustimmen und zudem festlegen, ob also zum Beispiel Texte nur gelesen oder auch ausgedruckt werden dürfen.

Dieses so genannte «Opt In»-Verfahren ist der entgegen gesetzte Weg, den Google geht. Dort können Autoren lediglich in einem «Opt Out»-Verfahren die Nutzung ihrer bereits eingescannten Werke untersagen.

Seitenhieb auf Google
Das kann als deutlicher Seitenhieb auf Google gesehen werden. Das Unternehmen hatte in seinem «Google Print»-Programm begonnen, Bücher einiger großer Bibliotheken zu digitalisieren, ohne vorher Autoren oder Verleger um Erlaubnis zu bitten. Nachdem einige Autoren- und Verlegerverbände gegen dieses Vorgehen protestiert hatten, setzte Google ihnen eine Frist bis zum 1. November, in der sie der Firma mitteilen können, ob ihre Bücher in das Archiv aufgenommen werden dürfen oder nicht.

Ob dieses Ausstiegsangebot rechtmäßig ist, oder ob Google nicht vielmehr nur solche Bücher einscannen darf, deren Rechteinhaber die Erlaubnis dazu geben, ist umstritten. Drei Schriftsteller und der US-Schriftstellerverband The Authors Guild haben Ende September gegen Google geklagt.

Der zweite wichtige Unterschied zwischen den beiden Projekten liegt darin, dass im OCA-Archiv nicht nur Bücher, sondern verschiedene Formen digitalisierter Inhalte gespeichert werden. Worum es sich dabei genau handeln könnte, macht ein Blick auf die beteiligten Organisationen deutlich. Mitglieder der OCA sind neben Yahoo und dem Internet Archive das European Archive, die National Archives aus Großbritannien, der Verlag O'Reilly Media, die Prelinger Archives, die University of California und die University of Toronto. Vor allem das Internet Archive, die Prelinger Archives und die National Archives haben einen großen Bestand an digitalisierten Filmen, die in das OCA-Archiv aufgenommen werden sollen.

Yahoo will Informationen nicht hosten
Der dritte wichtige Unterschied zum «Google Print»-Programm besteht darin, dass Yahoo das digitalisierte Material zwar indexieren wird, diese Informationen aber allen Interessierten zur Verfügung stellen und das Archiv auch nicht selber hosten will. Das bedeutet, dass Nutzer die Inhalte des Archivs auch über die Google-Suche und andere Suchmaschinen finden können. Yahoo will zum indexieren der Inhalte Metadaten verwenden, die offenen Standards entsprechen: dem «Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH)» und RSS.

In einem Gastbeitrag im Yahoo-Suchblog beschreibt Brewster Kahle, Gründer und Chef des Internet Archive, wie das OCA-Projekt organisiert sein soll. Yahoo werde die Kosten dafür übernehmen, dass in einem ersten Schritt bedeutende Werke der amerikanischen Literatur aus der Bibliothek der University of California eingescannt werden. Diese Bücher werden im Internet Archive gespeichert und können dort abgerufen werden. Adobe und Hewlett-Packard, ebenfalls Mitglieder der OCA, werden die notwendige Technik zur Verfügung stellen. Das erste digitale Material soll Ende des Jahres abrufbar sein. «Die Zusammenarbeit mit Yahoo ist großartig, weil sie verstehen, worum es geht, und weil sie die Möglichkeiten haben, das auch umzusetzen,» schreibt Kahle.

Was die Urheberrechte der Inhalte angeht, schreibt Kahle, gehe es in erster Linie darum, weiter verwendbare Daten in hoher Qualität abrufbar zu machen. Wenn Werke noch dem Urheberrecht unterliegen, habe man gute Erfahrungen mit Inhalten gemacht, die unter Creative Commons, einer Lizenz für offene Inhalte, lizenziert sind.

Spender können Material selbst anbieten
Die Spender des Projekts sollen die Wahl haben, das digitalisierte Material nur über ihre eigenen Server anzubieten, wenn sie das wollen. Sowohl Yahoo als auch die University of California hätten aber schon angekündigt, die von ihnen beigetragenen Dokumente vollständig frei zu geben – das bedeutet, dass auch andere Bibliotheken oder Suchmaschinen die Daten auf ihren Servern bereit stellen dürfen, schreibt Kahle.

«Das ist die Art von Zusammenarbeit, auf die wir lange Zeit gewartet haben,» sagte Daniel Greenstein, Bibliothekar der California Digital Library an der University of California, gegenüber der «New York Times». «Büchereien digitalisieren ihre Bestände und machen sie zugänglich, aber keine Bibliothek hat alles. Jetzt können wir sagen: ‚Wir haben eine bestimmte Ausgabe von Mark Twain, aber sie ist nicht so gut wie die in einer anderen Bibliothek’, also fügen wir die einfach unserer Sammlung hinzu.»

Bescheidener Umfang
Wenn man Greensteins Angaben der «New York Times» gegenüber zum Maßstab nimmt, wird das OCA-Projekt zumindest zu Beginn allerdings wesentlich bescheidenen ausfallen als «Google Print». Bis zu 20.000 Bücher sollen innerhalb des kommenden Jahres eingescannt werden. Allein die University of Michigan, eine der sechs Partner-Bibliotheken des Google-Programms, will sämtliche sieben Millionen Bücher in ihren Beständen digitalisieren. Diese wären dann allerdings lediglich über «Google Print» durchsuchbar. Und auch das nur, solange die Rechteinhaber nicht widersprechen. Lesen könnten die Nutzer in denjenigen Büchern, die dem Urheberrechtsschutz unterliegen, ohnehin nur kurze Ausschnitte.

Auch in Europa wird an einem vergleichbaren Projekt gearbeitet. Erst am vergangenen Freitag hatte die Europäische Kommission angekündigt, Europas geschriebenes und audiovisuelles Erbe zu digitalisieren und im Internet für alle Bürger verfügbar zu machen. Dazu schlägt die Kommission vor, dass die EU-Mitgliedstaaten eng zusammen arbeiten um Bücher, Bilder und Tondokumente zu digitalisieren, zu bewahren und allen verfügbar zu machen.