Archiv für August 29th, 2008
Wir testen, justieren, programmieren und siehe da…das BKA
Qimaya befindet sich derzeit in der Testphase. Der Index ist noch klein, jedoch fokussieren wir uns zunächst auch nur auf Qualität, statt Quantität.
Immer wieder stellen wir Suchanfragen mit dem Zweck Bugs zu erkennen. Welche Ergebnislinks stellen sich plötzlich tot, welche URL lässt sich nicht crawlen und was macht überhaupt das Frontend?
Qimaya basiert auf einem neuartigen Algorithmus und wir wissen was wir bzw. Qimaya kann. Jedoch lassen manche Ergebnisse selbst uns erstaunen. Schon jetzt, mit einem noch recht begrenzten Index, stoßen wir auf Webseiten, die mit vergleichbaren Diensten im Verborgenen blieben. So erhielten wir unter dem Suchwort Kreuzberg neben weiteren Ergebnissen einen Hinweis des BKA auf eine zur Fahndung ausgeschriebenen Person mit letzter Wohnhaft in Berlin Kreuzberg.
Warum dies so spektakulär für uns ist? Das ist leicht zu erklären, Qimaya durchsucht den vollständigen Inhalt einer Webseite und gleicht eben nicht nur das Suchwort mit der Webseite ab. Durch das Erfassen der vollständigen Inhalte bildet Qimaya eine Art inhaltliches neuronales Netz ab und kann hierdurch die Relevanz eines Ergebnisses weitaus exakter gewichten, als es zum Beispiel der bisher verwendete PageRank vermag. Das oben genannte Ergebnisse basiert auf der Suche im vollständigen Inhalt einer Webseite, denn der nachfolgende Link wurde nicht aufgrund seiner Verlinkungsstruktur als relevanteres Ergebnis lokalisiert.

http://www.bka.de/fahndung/personen/meistgesuchte
/krauth/lebenslaufheidbreder.html
Qimaya sucht nach inhaltlicher Relevanz, nicht nach Prominenz.
Autor: Roy









