[an error occurred while processing this directive]

Einführung in die Grundlagen der Web-Suche mit Hilfe einer Suchmaschine. [] (Suchmaschine, Suchen, Web-Suche), Lektion, Seite 721333
https://www.purl.org/stefan_ram/pub/suchen_grundlagen_de ist die kanonische URI dieser Seite.
Stefan Ram

Grundlagen der Web-Suche

Diese Lektion erklärt die Grundlagen der Suche nach Web-Seiten mit Suchmaschinen. Es folgen Übungen für die ersten Schritte bei der Arbeit mit einer Suchmaschine. Spezielle Aspekte und fortgeschrittene Suchtechniken werden in anderen Lektionen behandelt.

Volltextsuche

Die meisten Suchmaschinen arbeiten mit einer Volltextsuche. Dabei wird jedes Wort  einer Seite registriert. Wird nach einem Wort gesucht, werden dann alle Seiten angezeigt, die das gesuchtes Wort enthalten.

Wörter, nicht Themen

Das Prinzip der Volltextsuche erscheint einfach, es kann aber recht verwirrend sein: Denn mit der Sucheingabe "Pferd" wird jede  Seite gefunden, auf der das Wort  „Pferd“ vorkommt. Viele Mißverständnisse und Enttäuschungen bei der Benutzung von Suchmaschinen kommen dadurch zustande, daß erwartet wird, es würden mit der Sucheingabe "Pferd" statt dessen Seiten gefunden, die sich inhaltlich mit den Säugetieren der Gattung Pferd  (Equus ) beschäftigen.

Es kann natürlich vorkommen, daß bei der Suche mit der Sucheingabe "Pferd" auch Seiten gefunden werden, die sich wirklich mit den Säugetieren der Gattung Pferd beschäftigen. Genausogut können aber auch Seiten gefunden werden, auf denen das Wort „Pferd“ mehr oder weniger zufällig erscheint, wie beispielsweise diese Seite hier, die sich ansonsten in keiner Weise mit Pferden beschäftigt.

Solche Suchergebnisse sind aber nicht fehlerhaft, sondern entsprechen genau dem Prinzip der Volltextsuche. Wer wirklich Informationen zum Thema Pferde sucht, der kann die Suchanfrage anders formulieren und damit Seiten finden, die seinen Wünschen besser gerecht werden, indem er sich überlegt, welche Wörter auf einer Seite, die sich mit dem gewünschten Thema beschäftigt vorkommen sollten und seine Suchanfrage entsprechend formuliert: Das Wort „Pferd“ selber ist für solch eine Suchanfrage nicht immer die beste Wahl, obwohl es zunächst naheliegend ist.

Kochbücher
Für die Sucheingabe "Kochbuch" wurden 121.000 Treffer angezeigt (am 23. September 2002). Bedeutet das, daß 121.000 Kochbücher gefunden wurden?
Portugal
Ein Moderator erzählt in einer Fernsehsendung „Portugal  ist im Moment in aller Munde. Bei der Eingabe des Wortes in eine Internet-Suchmaschine wurden mehr als 10 Millionen Seiten über Portugal  gefunden.“ Welchem Irrtum (oder welchen Irrtümern) ist der Moderator möglicherweise erlegen?
Mai
Um herauszufinden, wie oft der Monat Mai  erwähnt wird, wurde das Wort "Mai" in eine Web-Suchmaschine eingegeben. Die Suchmaschine berichtete im März 2003 von 15.400.000 Treffern. Bedeutet dies, daß der Monat Mai  mehr als 15 Millionen Mal im Web erwähnt wurde?

Wörter, nicht Begriffe

Eine Suchmaschine kann weder Suchanfragen so verstehen wie ein Mensch noch die Gedanken und Wünsche des Benutzers lesen. Sie kann nur Seiten finden, welche die angegebenen Wörter enthalten. Ein weiteres Beispiel zur Illustration dieser Tatsache sind Homonyme. Das Wort „Pferd“ ist beispielsweise auch die Bezeichnung eines Sportgerätes, das beispielsweise beim Turnen verwendet wird. Wenn eine Suchmaschine nun die Sucheingabe "Pferd" erhält, dann kann sie nicht wissen, ob das Tier, das Sportgerät  oder eine andere metaphorische Bedeutung  gemeint ist. Sie versteht das Wort ja auch gar nicht, sondern listet nur Seiten auf, die das Wort „Pferd“ enthalten, egal in welcher Rolle es auf diesen Seiten vorkommt.

Das bedeutet aber nicht, daß Suchmaschinen es nicht erlauben, nach bestimmten Begriffen zu suchen, denn durch geschickte Formulierung einer Suchanfrage kann ein Rechercheur es erreichen, daß vorwiegend Seiten zu dem gewünschten Thema gefunden werden.

Seitenlisten

Eine Suchmaschine beantwortet eine Suchanfrage oft mit einer Liste von Seiten (Treffern), die das gesuchte Wort enthalten. Bei vielen verbreiteten Wörtern gibt es aber oft gleich Tausende von Treffern. Die Suchmaschine zeigt dann meistens nur die ersten zehn oder hundert Treffer an. Oft ist es auch nur möglich maximal die ersten tausend Treffer überhaupt zu sehen. Die meisten Rechercheure lesen aber sowieso nur die ersten zehn oder hundert Treffer.

Damit wird die Reihenfolge, in der eine Suchmaschine die Suchergebnisse anzeigt, wichtig. Denn, wenn eine wichtige Seite erst an Position 5000 erscheint, dann wird sie wohl niemals gefunden werden. Damit der Suchende die Kontrolle darüber hat, welche Suchergebnisse ihm angezeigt werden, sollte er versuchen, das Suchergebnis durch geeignete Sucheingaben selber schon so weit einzuschränken, daß nur noch möglichst relevante Seiten als Ergebnis erscheinen.

Plazierung

Einige Suchmaschinen versuchen, den Suchenden zu unterstützen, indem sie eine Bewertung der Treffer vornehmen: Wenn sich eine Seite mit Pferden beschäftigt, dann wird das Wort „Pferd“ vermutlich eher im Titel der Seite oder in Überschriften vorkommen als bei Seiten, auf denen das Wort eher zufällig erwähnt wird. Das spricht dafür, Seiten mit einem Suchwort im Titel oder in Überschriften weiter vorne aufzulisten.

Bei Suchmaschinen mit solchen Techniken kann man davon ausgehen, daß weiter vorne stehende Seiten oft auch relevanter hinsichtlich der Sucheingabe ist. Da das Plazierungsverfahren allerdings auch manche Seiten unzutreffend einstufen kann, darf man der Reihenfolge der Suchergebnisse nicht zu viel Gewicht beimessen.

Übungsaufgaben

Für die folgenden Übungsaufgaben soll eine Suchmaschine verwendet werden. In dieser Lektion wird aber keine bestimmte Suchmaschine angegeben, da die folgenden Übungsaufgaben mit jeder Suchmaschine erledigt werden können.

Einfache Suche
Suchen Sie Webseiten, die das Wort „Katachrese“ enthalten. Können Sie einer dieser Seiten entnehmen, was das Wort bedeutet? Wie viele Seiten wurden dabei insgesamt gefunden? Wie viele Seiten enthalten das Wort „Degloxan“, wie viele das Wort „doxastisch“ und wieviele das Wort „Pferd“?
Suche mit Tabu
Suchen Sie nach Seiten zu einem bestimmten Thema. Allerdings ist das Wort, welches das Thema direkt beschreibt, dabei tabu. Es darf also nicht in ihrer Sucheingabe vorkommen!
Geben Sie statt dessen einige möglichst spezielle deutschsprachige Fachwörter  aus dem betreffenden Bereich ein, die sich möglichst stark voneinander unterscheiden, aber alle zu dem Thema gehören.
Für das Thema „Pferd“ könnten Sie beispielsweise einige Fachwörter aus der folgenden Liste auswählen: Hengst, Stute, Fohlen, Remonte, Wallach, Sattel, Halfter, Trense, Kehlriemen, Trab, Galopp, Tölt, Fluchttier, Equiden, Falbe, Ganasche, Hanken, Hinterzwiesel, Schweif, Kardätsche, Huföl, Nüstern, Flehmen, Hinterbein, Schweißmesser.
Welche Fachwörter würden zum Thema „Automobil“ passen?
Denken Sie noch an einige andere Themen und suchen Sie jeweils mit Fachwörtern, ohne das Thema selber zu verwenden! Überfliegen Sie möglichst nicht nur die ersten 10 Treffer, sondern schauen Sie sich dann gegebenenfalls eher 30 oder 40 Treffer an.
Falls nicht gleich mehrere passende Fachwörter bekannt sind, hilft eine erste Suche mit einigen schon bekannten Fachwörtern oft, um dann weitere speziellere Fachwörter zu finden.
Fleck entfernen
Auf einer weißen Baumwollhose wurde ein Rostfleck festgestellt. Suchen Sie nach Tipps zur Beseitigung solcher Rostflecken von Stoff (Kleidung).
Millionär werden
In der Fernsehsendung „Wer wird Millionär“ wurden am 21. September 2002 unter anderem die folgenden Fragen gestellt. Benutzen Sie eine Suchmaschine, um die richtige Antwort zu finden oder sich einer vermuteten Antwort zu vergewissern.
Wo befindet sich das Raumfahrtzentrum Baikonur? A: Kasachstan, B: Usbekistan, C: Turkmenistan, D: Aserbaidschan.
Worauf bezieht sich das Wort „digital“ in der Medizinersprache? A: Nerv, B: Finger, C: Haar, D: Ader.
Der Führende in der Bergwertung bei der Tour de France trägt das Trikot mit den …? A: roten Punkten, B: gelben Streifen, C: blauen Kreisen, D: schwarzen Kästchen.
Cho-Cho-San heißt die Hauptfigur der Oper …? A: La Traviate, B: La Bohème, C: Nabucco, D: Madame Butterfly.
Als was wurden Abbott und Costello weltberühmt? A: Komikerduo, B: weiße Tiger, C: Sexualforscher, D: Comiczeichner.
Ordnen Sie die deutschen Formel-1-Piloten der Saison 2002 von alt nach jung! A: Nick Heidfeld, B: Ralf Schumacher, C: Michael Schumacher, D: Heinz-Harald Frentzen.
Bestimmte Texte finden
Finden Sie ein Exemplar des Strafgesetzbuches, ein Exemplar der Bibel, den Text des Liedes „99 Luftballons “.
Bestimmte Texttypen finden
Finden Sie eine Liste der Ortskürzel deutscher Kfz-Kennzeichen. Finden Sie eine Liste deutscher Homonyme (auch „Teekessel “ oder „Teekesselchen “ genannt), also von Wörtern mit mehreren ganz verschiedenen Bedeutungen.
Nützliche Kalendarische Informationen
Finden Sie Seiten zur Beantwortung folgender Fragen:
Wann sind in diesem Jahr Schulferien in Ihrem Bundesland?
Wann sind in diesem Jahr gesetzliche Feiertage in Ihrem Bundesland?
Zu welchen Zeitpunkten ist das von Ihnen bevorzugte Kaufhaus am Silvestertag diesen Jahres geöffnet?
Zu welchen Zeitpunkten ist der von Ihnen bevorzugte Lebensmittelhändler am Silvestertag diesen Jahres geöffnet?
Briefporto
Finden Sie möglichst zuverlässige Quellen zum aktuellen Porto für einen Brief.
Alte Preise
Finden Sie Listen mit historischen DM-Preisen (Preisen in Deutscher Mark) üblicher Lebensmittel und Waren des täglichen Bedarfs und Preise üblicher Speisen und Getränken in der Gastronomie aus dem 20. Jahrhundert in der Bundesrepublik Deutschland.
Informationen über das persönliche Umfeld
Suchen Sie nach Informationen über die Straße, in der Sie wohnen (falls Sie diese Information nicht preisgeben wollen, suchen Sie statt dessen nach Informationen über eine andere Straße).
Suchen Sie nach Ihrem Geburtsdatum (z.B. "25. Januar 1940") oder einem Geburtsdatum einer Ihnen bekannten Person, um zu erfahren, ob an diesem Tag sonst noch irgend etwas anderes geschah.
Markenrecherche
Denken Sie sich einen kurzen, möglichst gut aussprechbaren und merkbaren Namen für ein neues Kopfschmerzmittel aus. Stellen Sie durch eine Websuche sicher, daß der von Ihnen erdachte Name ganz neu ist, also noch von niemanden verwendet wurde und auch kein Wort irgendeiner Sprache ist. Er darf also nicht auf irgendeiner Seite gefunden werden. (Dieses Vorgehen ist allerdings nicht immer zuverlässig, da es eingetragene Marken geben kann, die so nicht gefunden werden. Für eine richtige Markenrecherche müssen daher noch andere Quellen herangezogen werden.)

Seiteninformationen und Impressum   |   Mitteilungsformular  |   "ram@zedat.fu-berlin.de" (ohne die Anführungszeichen) ist die Netzpostadresse von Stefan Ram.   |   Von der Stefan-Ram-Startseite ausgehend finden sich oft noch mehr Informationen zu Themen, die auf einer Seite angesprochen wurden. (Eine Verbindung zur Stefan-Ram-Startseite befindet sich ganz oben auf dieser Seite.)  |   Der Urheber dieses Textes ist Stefan Ram. Alle Rechte sind vorbehalten. Diese Seite ist eine Veröffentlichung von Stefan Ram. slrprd, PbclevtugFgrsnaEnz