Suchkonzepte



next up previous contents index
Next: Suchen in WAIS-Datenbanken Up: Grundlagen Previous: Das Directory-of-Servers

Suchkonzepte

  Bevor die konkrete Arbeit mit WAIS-Clients dargestellt wird, noch einige wichtige Begriffe und Hintergründe zu den Suchmechanismen und -konzepten, die man kennen sollte.

Für WAIS-Suchanfragen sind keine Kenntnisse einer bestimmten Informelle Anfragesprache Anfragesprache erforderlich, Begriffe können einfach eingegeben werden; das ursprüngliche WAIS-Konzept sah nur ,,natürlich sprachliche`` Anfragen auf unstrukturierten Dokumenten vor. Neuere Serverimplementierungen (siehe Kap. gif) bearbeiten jedoch auch (ansatzweise) boolsche Operatoren und Wildcards (z.Z. nur Rechtstrunkierung). Wildcards dienen der Eingabe unvollständiger Suchbegriffe, z.Z. muß mindestens der Anfang eines Suchbegriffs eingegeben werden (z.B. hum* findet hum, human, humbug ...). In Zukunft wird wohl auch ,,Fielded Search`` in freeWAIS möglich sein; kommerzielle WAIS-Server bieten schon die Möglichkeit, mit teilstrukturierten Dokumenten zu arbeiten; in der Suchanfrage bestimmte Datensatzfelder anzugeben und so die Ergebnismenge einzuschränken.

Eng mit der informellen Anfragesprache verknüpft ist die Art und Weise wie Relevance Ranking, Score WAIS Suchanfragen bearbeitet und beantwortet. Dokumente der Datenbank werden im Hinblick auf ihre Relevanz bezüglich der Anfrage bewertet und geordnet. Abhängig davon, ob, wie häufig und wo Begriffe der Anfrage in einem Dokument vorkommen, werden Punkte (scores)   vergeben. Das Dokument mit der höchsten Punktezahl bekommt den Wert 1000 zugeordnet, alle anderen relevanten Dokumente werden relativ dazu zwischen 1 und 1000 bewertet (relevance ranking).   Treten beispielsweise Begriffe einer Anfrage in einer Dokumentenüberschrift auf, bekommt dieses mehr Punkte als ein Dokument, das den gleichen Begriff der Anfrage nur im Text enthält.

Eine weitere interessante Navigationstechnik Relevance Feedback des urspünglichen WAIS-Konzepts ist Relevance Feedback.   Dabei können Dokumente oder Teile eines Dokuments als Anfrage verwendet werden. Hat man beispielsweise einen Text gefunden, der interessant aussieht, kann man so den Server beauftragen, weitere Dokumente zu suchen, die dem ausgewählten Text ähnlich sind.

Durch die Verwendung von Relevance Feedback wird die ursprüngliche Anfrage erweitert. Das Gewicht der Treffer der Begriffe aus dem ,,Feedback``-Dokument bei der Bewertung relevanter Datenbankeinträge ist jedoch niedriger als das Gewicht der Treffer der Begriffe der Originalanfrage.

Der Inhalt von WAIS-Datenbanken ist nicht nur auf Textdokumente Text, Grafik und Ton beschränkt, sondern umfaßt auch Graphiken, Tondokumente und in neueren Serverimplementierungen Multi-Type-Dokumente. 

Multi-Type-Dokumente sind Dokumente mit unterschiedlichen Repräsentationen. Zum Beispiel: Ein Bild liegt in einem binären Format vor, dazu gibt es einen erklärenden Text oder sogar ein Tondokument. Alle diese zusammengehörigen Dokumente werden als ein einziges Multi-Type-Dokument betrachtet. Während ursprünglich bei Dokumenten, die nicht als Text vorlagen, nur die Begriffe aus den Überschriften als Suchbegriffe zur Verfügung standen, können bei neueren Servern explizit beim Anlegen der Datenbank, assoziierte Textdokumente als suchrelevant angegeben werden. Bei Anfragen wird dann auf der Basis des Textes gesucht, der Client kann entscheiden, welche Repräsentation er anzeigen kann resp. will.



next up previous contents index
Next: Suchen in WAIS-Datenbanken Up: Grundlagen Previous: Das Directory-of-Servers



Aus: Internet: Werkzeuge und Dienste
Copyright Springer-Verlag Berlin Heidelberg 1994