|
emco: deutsch >Know-how >Computer und Internet >Recherche im Internet >Anfragebearbeitung >
Anfragebearbeitung
Welche Funktionalitäten eine Suchmaschine bei der Anfragebearbeitung bietet, ist natürlich von der Erschließung der Dokumente abhängig. Je besser die Analyse und Indizierung der Dokumente ist, desto umfangreicher ist das Angebot an Suchmethoden und -operatoren.
Die Eingabemaske ist nach der Funktionalität ausgerichtet und bei den meisten Suchmaschinen über verschiedene Stufen komfortabel bedienbar:  | Verschiedene Suchmodi (Einfache / Erweiterte Suche)
|  | Formularbasierte Suchmasken mit diversen Einstellmöglichkeiten.
|  | Einstellungen werden teilweise über Buttons, Menüs, Listen usw. ausgewählt.
|  | Ergebnislisten mit Ranking, Sortierung, Blätterfunktionen usw. |
Für die Relevanzbeurteilung (Ranking) und die damit verbundene Sortierung der Treffermenge werden fast nur statistische Methoden verwendet:  | Anzahl gefundener Suchbegriffe in einem Dokument. Dabei wird die Gesamtanzahl aller Suchbegriffe gemessen. Dokumente, die alle Suchbegriffe beinhalten, werden als "besser" bewertet.
|  | Funktion (Position) der gefundenen Begriffe, z.B. werden Begriffe aus der URL und dem Titel stärker gewichtet.
|  | Häufigkeit eines Suchwortes innerhalb eines Dokuments
|  | Nähe von Suchbegriffen innerhalb des Textes
|  | Gesamthäufigkeit eines Suchwortes
|  | Gesamtanzahl eines Suchbegriffs in allen Dokumenten. |
Immer mehr Suchmaschinen gehen aber auch dazu über, die Popularität eines Dokuments beim Ranking zu bewerten. Je öfter ein Dokument über eine Suchmaschine nachgewiesen wird, desto höher wird dieses im Rankingverfahren bewertet. Manche Suchmaschinen erlauben aber auch die Sortierung der Trefferliste nach anderen Kriterien wie Größe, Alter oder nach Servern. Die Sortierung nach Servern (Excite) bietet eine leichte Verbesserung der Relevanzbeurteilung für den Benutzer, da sich auf einem Server meist gleichartige Dokumente befinden. So genügt es oft, nur noch ein Dokument pro Server zu betrachten. AktualisierungTechnisch gesehen ist beim Übertragen einer WWW-Seite ein für die Aktualisierung wichtiger Mechanismus im WWW-Protokoll vorhanden:
- "If-Modified-Since"-Feld im HTTP-Request
Über die Angabe dieses Feldes kann beim Laden eines Dokuments über das Internet die Übertragung von der letzten Änderung (Datums- und Uhrzeit) abhängig gemacht werden. Falls das Dokument seit dieser Zeitangabe geändert wurde, wird es übertragen, sonst nicht.
Wie häufig eine Suchmaschine die erfassten Dokumente aktualisiert, ist sehr unterschiedlich:
- Die Angaben der Aktualisierung einer kompletten Datenbank der Suchmaschinen schwanken zwischen wenigen Stunden und mehreren Monaten.
- Abhängig von der Zugriffshäufigkeit eines Dokuments.
- Seiten, auf die bei mehrmaligen Versuchen nicht zugegriffen werden konnte, werden von den meisten Suchmaschinen wieder gelöscht.
Autor: Andreas Konitzer. © Andreas Konitzer 2003.
Weiter zu: Vorgehensweise bei der Suche
|