Mein Online-Portfolio
Richtige Bewertung der Relevanz und Qualität der gefundenen Informationen – Lösung (Maschine)
Für eine erfolgreiche Suche muß man wissen, wie man die Relevanz und Qualität der gefundenen Informationen/Informationsquellen richtig bewertet – Lösung
Wie löst Google das Problem ?
Grundsätzlich bewertet Google wie die anderen Suchmaschinen auch mit einem maschinellen Bewertungssystem (Ranking-Algorithmus oder konkret der „Pagerank-Technologie“) die Relevanz der gefundenen Informationen/Informationsquellen zur Suchanfrage und sortiert sie ihrer Relevanz entsprechend in die Suchergebnisseiten ein. Das Bewertungssystem von Google gleicht einer kollektiven Umfrage unter den Informationsanbietern (Webautoren) im Internet.
Wie aus unterschiedlichen Informationsquellen (at-web.de, der Journalist Henk van Ess, …) zu entnehmen ist, helfen auch menschliche Redakteure bei der Qualitätsbewertung der Informationen. Grundsätzlich wäre das sehr konstruktiv, denn die Maschinen verstehen die Inhalte nicht, da sie die menschliche Sprache nicht verstehen. Durch die Kombination aus Pagerank-Technologie und menschlichen Redakteuren, kann die Qualität der Suchergebnisse wesentlich verbessert werden. Dazu mehr bei den nachfolgend genannten Mängeln dieser Technologie.
Das wichtigste Relevanz-Kriterium für Google ist, wie viele andere Internetanbieter mit einem Link auf die gefundene und als relevant eingestufte Seite verweisen und vor allem, wie hoch Google den Wert (Pagerank) der verweisenden Internetanbieter festgelegt hat. Je mehr solcher Links vorhanden sind und vor allem, je höher ihr Pagerank ist, desto höher wird die Relevanz der gefundenen Seite bewertet. Dies beruht im Grunde auf dem Gedanken, daß ein Internetanbieter nur auf die Internetseiten verweist, die er für gut und interessant hält. Demzufolge müssen also die Internetseiten, auf die viele Internetanbieter verweisen, beliebter sein als jene, auf die wenige oder niemand verweist.
Der Pagerank ermittelt weiterhin, wie viele andere Internetanbieter die jeweils verweisenden Seiten immerhin so gut finden, daß sie diese verlinken und so weiter. Darüber hinaus prüft Google auch, wie relevant die Inhalte der verweisenden Seiten zur gefundenen sind – dazu wird auch kontrolliert, ob die Seite bzw. die Website, aus der sie stammt, in einer entsprechenden Kategorie eines allgemeinen Suchkatalogs von einem Redakteur eingeordnet wurde.
Die „Pagerank-Technologie“ verdient absolute Anerkennung, hat aber auch einige entscheidende Mängel:
- Die „Pagerank-Technologie“ beruht auf mathematischen Berechnungsverfahren, die auf Internetseiten angewendet werden, deren Inhalt von der Maschine als relevant zur Suchanfrage bewertet wurde, ohne daß diese jedoch den Inhalt der Internetseiten wirklich versteht.Die Bewertung der Relevanz einer Internetseite beruht also wie bei allen anderen Suchmaschinen auch auf Annahmen, wie beispielsweise, daß eine Seite dann relevant ist, wenn dort der Suchbegriff häufig im Text vorkommt. Dies gilt natürlich auch für die verweisenden Internetseiten, deren Pagerank bewertet wird; die Suchmaschine, die den Inhalt von Seiten nicht wirklich verstehen kann, berücksichtigt nicht, ob sie inhaltlich zur Suchanfrage relevant sind. Das bedeutet, daß die Warnung eines glaubwürdigen Internetanbieters genauso zu einem besseren Ranking einer Seite beitragen kann wie die Empfehlung einer seriösen Quelle.
- Die Beliebtheit einer Seite ist noch kein Beweis für die tatsächliche Qualität und Relevanz der Information in Bezug auf die Suchanfrage.
- Im Grunde hängt die Bewertung einer Information von ganz individuellen Kriterien ab, die von einem maschinellen Bewertungssystem nicht berücksichtigt werden (können).
- Eine Suchmaschine erfaßt nur einen kleinen Teil aller im Web veröffentlichten Internetdokumente, die maschinelle Meinungsumfrage ist also zwangsläufig unvollständig.
- Das Bewertungssystem sorgt automatisch dafür, daß bereits sehr bekannte Anbieter (die, wie unter 1. beschrieben, nicht automatisch qualitativ hochwertige Inhalte liefern) noch bekannter werden, in dem sie weit vorne in der Trefferliste genannt werden. Das kommt daher, daß auf sehr bekannte Anbieter in der Regel auch viele andere per Hyperlink verweisen. Dieses Problem gilt natürlich analog für die Themen. Jene, die nur wenigen Anwendern bekannt sind oder nur von wenigen nachgefragt werden, gelangen nicht auf die vorderen Ränge, während teilweise völlig irrelevante Seiten, die beliebte Themen wie Autos oder Reisen behandeln, einen Spitzenplatz im Ranking einnehmen. Die Aufmerksamkeit wird nur auf das gelenkt, was bereits Aufmerksamkeit gefunden hat. Das bedeutet, daß gerade neue Anbieter und Internetseiten, die weniger bekannte Themen behandeln, sehr geringe Chancen haben, einen guten PageRank zu erhalten.
- Ein weiteres Problem betrifft die Tatsache, daß auch Internetangebote hoch bewertet werden, wenn auf sie zwar nur wenige Hyperlinks verweisen, diese aber selbst einen hohen PageRank besitzen. Diese Tatsache könnte sich der sehr bekannte Anbieter gut bezahlen lassen und dann auf das betreffende Internetangebot verweisen, jedoch eben nicht mit dem Hintergrund, daß er es tatsächlich gut findet.
Die Bewertungssysteme der anderen Suchmaschinen sind noch wesentlich ungenauer, etwa die bloße Zählung, wie oft und an welcher Stelle (Domain, Seitentitel, Überschrift,…) die eingegebenen Suchbegriffe in der gefundenen Internetseite vorkommen. Die allgemeinen und wenig flexiblen Universalmethoden, mit denen Maschinen die Relevanz und Qualität von Informationsquellen/Informationen bewerten, sind letztendlich auch verantwortlich für die meist hohe Anzahl irrelevanter Treffer.
Tatsache ist, daß keines der maschinellen Bewertungssysteme den tatsächlichen Zusammenhang zwischen dem, was der Suchende mit seiner Suchanfrage tatsächlich finden möchte, und dem Inhalt des Internetdokuments versteht und somit nachweislich auch keine sichere Bewertung der Relevanz bewerkstelligen kann. Dies wäre auch ein Ding der Unmöglichkeit, da das Bewertungssystem im Prinzip über das aktuelle Wissen der Menschheit verfügen und jeden persönlich genau kennen müßte.
Neben der Rankingtechnologie ist die Präsentation der einzelnen Treffer ein weiterer wesentlicher Erfolgsfaktor von Google. Als Trefferbeschreibung verwendet die Suchmaschine die nähere Textumgebung, in der die Suchbegriffe vorkommen. Dies ermöglicht dem Anwender eine schnelle Entscheidung, ob ein Treffer grundsätzlich relevant ist oder nicht.
Diese Trefferpräsentation löst drei grundsätzliche Probleme, nämlich daß ein und dieselbe Suchanfrage nicht unbedingt mit der gleichen Erwartung an das Suchergebnis gestellt wird, die Suchmaschine nicht auf alle Erwartungen entsprechende Handlungsmuster parat haben kann und viele Suchenden ihre Erwartung häufig selber nicht genau definieren können. Die Suchmaschine präsentiert also Lösungen und der Suchende kann schnell entscheiden, welche für ihn die richtige sein könnte.
Handelt es sich bei dem Treffer um eine „relevante“ Informationsquelle, so ist aber noch lange nicht sichergestellt, daß der Anwender diese auch im weiteren Verlauf der Suche dazu verwenden kann, um bestimmte Informationen zu finden.
Beim nächsten Teil geht es darum wie ein Mensch mit grundlegender Netzwerkkompetenz, die Relevanz und Qualität der gefundenen Informationen/Informationsquellen bewertet.
Hinterlasse einen Kommentar
An der Diskussion beteiligen?Hinterlasse uns deinen Kommentar!