Suchstrategie für Volltext-Suchmaschinen
Im folgenden soll eine Suchstrategie für die Verwendung mit Volltext-Suchmaschinen dargestellt und kommentiert werden.
1. Formulieren einer Frage
Der erste Schritt ist die Formulierung einer verbalen Frage, die die gesuchte Information so präzise wie möglich umschreibt. Dabei ist es hilfreich, folgende Fragen zu beantworten:
A) Was weiß ich? – Damit kann man festlegen, welche Informationen von der Suche ausgeschlossen werden können.
B) was will ich wissen? Welche Begriffe stehen mit der gesuchten Information im Zusammenhang? -Die Beantwortung dieser Fragen hilft bei der Suche nach den Schlüsselwörtern, die in die Suche eingeschlossen werden können.
2. Festlegung der Schlüsselwörter und Redewendungen für die Suche
Wichtig ist dabei Alternativen für die unter Punkt 1 ermittelten Schlüsselwörter mit in die Suche aufzunehmen. Hierzu kann der Thesaurus eines Textverarbeitungsprogramms gute Dienste leisten.
Weiterhin sollte man sich Gedanken darüber machen, wie und in welcher Reihenfolge die Schlüsselwörter in die Suche mit einbezogen werden sollten. Von besonderer Bedeutung ist dabei das Auffinden sinnvoller bzw. das Ausschließen sinnloser Kombinationen der einzelnen Schlüsselwörter. Folgende Übersicht kann dabei hilfreich sein:
Hierarchie der Begriffe nach zunehmender Häufigkeit in Dokumenten (nach Stefan Karzauninkat – Die Suchfibel)
- Einzelner, komplizierter, seltener Begriff
- Spezieller Begriff zu einem speziellen Thema
- Spezieller (Ober-)Begriff, der in mehreren unterschiedlichen Zusammenhängen auftreten kann
- Gebräuchlicher Begriff, der in mehreren unterschiedlichen Zusammenhängen auftreten kann
- Oberbegriff
- Allgemeiner Oberbegriff, Kategorie
- Häufig gebrauchter, allgemeiner Begriff
- Füllwort, Artikel, Pronomen
3. Wahl der Suchmaschine und Formulierung der Abfrage
Für die Formulierung der Suchabfrage ist es notwendig, sich eine geeignete Suchmaschine zu wählen. Gibt es zum Beispiel zur gesuchten Information eine thematische Suchmaschine, so ist es meist günstiger, die Suche mit dieser Suchmaschine zu beginnen, da auf diese Art und Weise eine Vielzahl von Fehlschlägen ausgeklammert werden kann.
Nach der Wahl der Suchmaschine ist es dringend notwendig (spätestens nach einem erfolglosen Testlauf mit dem Standardsyntax), sich mit dem dort geforderten Syntax für die Abfrage vertraut zu machen. Erst jetzt kann man die eigentliche Abfrage formulieren.
4. Suche durchführen und bewerten
Mit der unter Punkt 3 formulierten Abfrage wird jetzt die Suche durchgeführt. Anschließend sollte man mindestens die ersten 10 bis 20 Treffer einer näheren Prüfung unterziehen. Ist die gewünschte Information nicht enthalten, ist eine Neuformulierung der Suche ratsam. Dabei kann man entweder die Suche weiter spezifizieren oder komplett neu formulieren. Manche Suchmaschinen geben dem Nutzer auch die Möglichkeit, durch Suche nach ähnlichen Seiten oder einem
Suchassistenten, die Suche zu verfeinern bzw. die Bewertung der Suchergebnisse zu beeinflussen (Anmerkung: Die größten Unterschiede der Suchmaschinen bestehen in der Art und Weise, wie diese die Ergebnisse eines Suchlaufes bewerten. Häufig wird sich mittlerweile über diese Mechanismen ausgeschwiegen, um Missbrauch vorzubeugen. Auch hat die Unsitte um sich gegriffen, bezahlte
Verweise an den Anfang der Ergebnissliste zu stellen)
5. Ranking der Suchmaschinen
Man sollte sich nicht durch die Bewertungen der einzelnen Suchmaschinen verwirren lassen. Es ist natürlich das Bestreben der Suchmaschinenbetreiber (neben dem Einnehmen von Geld, was an erster Stelle steht) möglichst gute Treffer dem Suchenden zu bieten, damit er wieder diese Suchmaschine benutzt. Daher werden die Treffer (ausser den bezahlten Treffern) von den Suchmaschinen bewertet. Jedoch macht das jede Suchmaschine nach einer mehr oder weniger gut gehüteten
Geheimformel. So kann unter anderem das Häufigkeit eines Wortes im sichtbaren Bereich sowie die Position eine Rolle spielen. Auch das Vorkommen innerhalb der (normalerweise) nicht sichtbaren Meta- Daten kann beim Ranking eine Rolle spielen. Weiterhin kann die Anzahl der Verweise von anderen Seiten eine Rolle spielen sowie diverse Kombinationen aus diesen und anderen Möglichkeiten.
Pr(a)= (1-d) + d (Pr(T1)/C(T1) + …+Pr(tN)/C(Tn))
Pr(a) ist dabei das Pageranking der Zielseite
d= Dämpfungsfaktor
Pr(Tn) = Pageranking einer auf die Zielseite A verweisenden Seite T
C(Tn) = Anzahl der externen Links der Seite T
N= Laufvariable für alle n auf die Zielseite A verweisenden Seiten T
Das Pageranking wird zu Begin des Rankingverfahrens für jede Seite mit einem Ausgangswert belegt, welcher sich im Verlauf der Bewertung ändert, wenn sich die Bewertung der verweisenden Seiten T ändert.