Google Books – Google lernt

Das Internet umfasst die unendlichen Weiten menschlichen Wissens. Etwa 1 Milliarde Webseiten gibt es in Internet. Seiten aus aller Welt enthalten verschiedene Inhalte. Nachrichten und Weblogs finden sich genauso, wie Unternehmenspräsentation, Unterhaltung und natürlich Pornografie. Um eine Seite zu finden gibt es drei Möglichkeiten. Man kennt sie und tippt die Adresse im Browser ein, oder gelangt über einen Link von einer anderen Website dorthin. Die dritte Möglichkeit bieten Suchmaschinen. Allen voran Google.

Googeln

Es gibt eine Handvoll Unternehmen, die es geschafft haben, in den Wortschaft aufgenommen zu werden. So kann man heute xeroxen, feedexen und googeln. Was auch immer man sucht, man wird bei Google fündig. Dabei hat der Internetriese seinen Algorithmus in den letzten Jahren dramatisch verbessert. Google erkennt ganz automatisch die Suchintention des Users. Die Zeiten, in denen man exakt das eingeben musste, was auf der Website steht um etwas zu finden sind vorbei. Bekam man früher für jede Schreibweise einer Phrase unterschiedliche Ergebnisse, so versteht die künstliche Intelligenz von Google heute, was man wissen will.

Internetzentrale

Als Webseitenbetreiber ist man bemüht Besucher auf die eigene Seite zu bringen. Man hält sich an alle Vorgaben, die Google macht und müht sich, wertvolle Informationen zusammenzustellen. Google hat dabei die uneingeschränkte Macht. Es gibt tatsächlich kein Internet ohne Google. Verhält man sich nicht gemäß der Richtlinien für Webmaster, dann wird man kurzerhand bestraft. Google schreibt ein freundliches Mail und löscht die Website aus den Suchergebnisse, oder zeigt sie deutlich weiter unten an. Nicht umsonst gibt es den Witz, dass die zweite Seite der Sucheregebnisse das beste Versteck der Welt sei. Die meisten User klicken einfach auf das erste Suchergebnis. Scrollen ist meist zu aufwändig und man verfeinert seine Suche, wenn man unter den ersten 3 Einträgen nicht fündig wird. Dabei entscheidet nur Google alleine, wer unter diesen 3 Einträgen angezeigt wird.

Google Books - Google lernt auf bizimliste.de
Die begehrten ersten Plätze in den Google Suchergebnissen

Informationsdiebstahl

Soweit kein Problem. Man muss Google zugute halten, dass die Suchergebnisse tatsächlich ausgezeichnet sind. Meist findet man das, was man gesucht hat. Oft sogar etwas, von dem man nicht wusste, was man sucht. Google weiß, was wir suchen und liefert es. Für den Webseitenbetreiber ist das toll. Das beste Ergebnis steht an erster Stelle. Man braucht also nur eine Website mit umwerfenden Informationen füllen und sie ideal aufbereiten. Dabei werden Details, wie die Ladezeit, der Einsatz einer Verschlüsselung und die Kompatibilität mit Mobilgeräten herangezogen. Hat man das alles geschafft, dann steht man ganz oben und bekommt Besucher. Dummerweise hat Google mittlerweile damit begonnen selbst die Useranfragen zu beantworten, statt auf die Informationsquelle zu verweisen.

Frage und Antwort

Stellt man etwa die Frage: „Wo steht der Eiffelturm“ liefert Google den Google Maps Eintrag, Werbeeinträge und natürlich die vollständige Adresse. Der Suchende muss nicht mehr weitersuchen. Google hat die Information direkt ausgegeben und hat keinen Besucher auf eine andere Website weitergeleitet. Die Adresse des Eiffelturms ist durchaus Allgemeingut, aber auch bei komplexeren Fragen findet Google die Antwort und präsentiert sie vor den Sucherergebnissen. Hat man die Information mühsam recherchiert und aufbereitet, dann liest Google sie ein und verwendet sie, um die Fragen direkt zu beantworten. Toll für den User und Google. Weniger toll ist es für den Urheber der Informationen.

Google Books - Google lernt auf bizimliste.de
Milliarden von Büchern existieren auf unserer Welt

Google Books

Das Internet entwickelt sich seit Anfang der 1990er-Jahre. Das sind aktuell noch keine 30 Jahre. Davor war es üblich, Informationen in Büchern festzuhalten. 2004 hat Google das Projekt Google Books gestartet. Ziel ist es, alle Bücher, die jemals gedruckt wurden, zu scannen und mittels Schrifterkennung durchsuchbar zu machen. Google erobert damit auch den mehr als 1.000 Jahre alten Informationsbestand, der in Büchern festgehalten ist. Auf den ersten Blick wirkt dieses Projekt ehrenwert. Die Idee, alle jemals niedergeschriebenen Texte für jeden Menschen online verfügbar zu machen, klingt überzeugend. Google überzeugt also eine Bibliothek nach der anderen Google ihren Bestand zum Scannen und indizieren zu überlassen.

Kehrseite

Allerdings ist das Projekt nicht für jeden gleichermaßen erfreulich. Autoren und Verlage sind beispielsweise rechtlich gegen Google vorgegangen. Allerdings kam es zu einer Einigung. Seltsam erscheinen auch die Verträge, die die Bibliotheken mit Google abschließen. Über eventuelle Zahlungen und alle anderen Details wird eisern geschwiegen. Auch der Vergleich mit Autoren und Verlagen ist geheim. Unerwartet ist auch, dass Google die Bücher nicht uneingeschränkt allen zur Verfügung stellt. Man kann auf einzelne Seiten zugreifen und die Bücher durchsuchen. Als Ergebnis erhält man jeweils den Absatz, in dem die Suchphrase vorkommt.

Google Books - Google lernt auf bizimliste.de
Lesen bildet. Davon könnte auch die künstliche Intelligenz hinter Google profitieren

Unendliche Weiten

Google scannt Millionen von Büchern und speichert den Inhalt. Die Hintergründe sind, wie bei den meisten Dingen, die Google tut, unbekannt. Was steckt also dahinter, wenn Google Milliarden von Buchseiten in seinen Datenbanken abspreichert? Eine Möglichkeit wäre es, das Google anhand der umfangreichen Texte lernt. Der Algorithmus zieht darauf ab, die Suchanfrage eine Users zu verstehen. Services, wie der Google Translator sind heute bereits in der Lage Texte zu verstehen. Das System lernt mit jeder Suchanfrage etwas dazu. Wieviel kann Google dann aus allen Büchern, die jemals geschrieben wurden, lernen? Vielleicht liest die künstliche Intelligenz hinter der Suchmaschine die Bücher und lernt damit noch mehr über uns.

Leave a Comment

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.