Qimaya – Semantic Web

creating a semantic web

Archive for September 2008

Feedback der Testnutzer

with 57 comments

In den Kommentaren möchten wir Euch bitten euer Feedback, Bugs und Auffälligkeiten zu posten. Wir werden so schnell wie möglich darauf eingehen um diese so zeitnah wie möglich zu beheben.

Here we go!

Advertisements

Written by Qimaya

30. September 2008 at 8:24 pm

Veröffentlicht in Uncategorized

Suche nach Inhalten, nicht nach Prominenz

with 9 comments

Als kleines Schmankerl möchte ich euch ein kleinen Einblick in die Ergebnisliste eines Suchbegriffes geben. Anhand des Suchwortes Kosmetik wird sehr schnell klar, was es bedeutet inhaltlich zu suchen und eben gerade nicht nach einem ordinärem Schlagwort.

Zunächst eine kurze Erklärung woraus die unterschiedlichen Ergebnisse resultieren und wie dies mit künstlicher Intelligenz zusammenhängt.

Bisherige Suchmaschine, nennen wir sie einmal Yahoogle, benutzen die kontextuelle Suche, auch als Bool´sche Suche bekannt. D.h. das Suchwort wird lediglich mit dem vorliegenden Text einer Webseite abgeglichen. Wurde das Suchwort gefunden, so gilt die Seite zunächst als Treffer, damit als potentielles Ergebnis. Da es in der Natur der Sache liegt bei mehreren Milliarden an Webseiten nun mindestens auch Millionen von Treffern, damit Ergebnisse zu erhalten, müssen diese nun noch „gerankt“ werden. Hier hat sich Larry Page im Jahre 1997 etwas trickreiches einfallen lassen.

Er adaptierte einfach den in der Wissenschaft benutzten Vorgang der Zitierung als Rankingmodell. Je öfter ein Wissenschaftler zitiert wird, umso wichtiger, d.h. relevanter ist dieser Wissenschaftler bzw. seine These. Dies wurde auf Webseiten übertragen. Je öfter eine Webseite verlinkt wird, umso interessanter, d.h. als Suchergebnis bedeutender, muss diese daher anscheinend sein.

Dieses Prinzip wird seit 1998 beibehalten, allerdings von derzeit 200 Kriterien ergänzt. Das Netz wird inzwischen jedoch nicht mehr nur von den großen Webseitenbetreibern, man könnte sagen, den Konzernen dominiert. Vielmehr ist das WWW inzwischen eine Art „Mitmach“ Netz. Böse Zungen benutzen auch gerne den inzwischen fast schon inflationär gebrauchten Begriff Web 2.0.

In Zeiten von Blogs, Youtube, Flickr, natürlich verlinke ich euch auch gerne direkt die deutschen Anbieter wie Sevenload und Imageloop, wird sehr schnell klar wie einfach es inzwischen ist zu verlinken und somit einen besseren Pagerank zu erreichen. Jeder redaktionelle Beitrag einer Onlinezeitung erhält inzwischen nicht nur eine Überschrift, sondern auch eine Bearbeitung nach SEO Grundsätzen.

Gerankt wird daher nur noch nach Prominenz, nicht mehr nach Relevanz!

Qimaya hingegen führt keine kontextuelle Suche durch, sondern erkennt den ganzen Inhalt einer Webseite, Wort für Wort, Satz für Satz. Die Verbindung eines jeden Wortes mit einem weiteren, sozusagen jedes Zeichen und damit auch jede Wortkette, ergibt eine bestimmte Inhaltsaussage. Ganz so, wie ein Mensch aus der spezifischen Aneinanderreihung von Zeichen und Worten sich den Sinn eines Satzes erschließt.

Hier ein Beispiel eines, in seinen Worten übereinstimmenden, Satzes.

„Zum Golf, aber er lässt sich spielend fahren.

„Golf Spielen, aber er lässt sich fahren“

Wie ein Mensch kann Qimaya somit auch erkennen ob es in den eben genannten Sätzen um Golfsport oder das Fahrzeug Golf geht.

Das Geheimnis ist also die Adaption des neuronalen Netzes des menschlichen Gehirns. Hierdurch können Inhalte nicht nur erkannt werden, sondern auch gerankt. Denn jeder gefundene Inhalt stellt zunächst auch einen Treffer, damit ein Ergebnis dar. Aber diese Inhalte werden wie im menschlichen Gehirn gegeneinander gestellt. Nur der stärkste Inhalt ist dann auch der relevanteste Inhalt.

Gerankt wird somit nach inhaltlicher Relevanz, nicht nach Prominenz!

Deutlich wird dies nunmehr zum Suchwort Kosmetik. Yahoogle rankt nach der Verlinkungsstruktur, damit der Prominez der Webseiten. Die Folge ist, dass, von Wikipedia einmal abgesehen, insbesondere Shoppingsseiten, die alles dafür tun gut gerankt zu werden, auch als Toptreffer angezeigt werden. Wikipedia macht sich diese Eigenschaft ebenso zu Nutze, den es ist gespickt mit Verlinkungen innerhalb des Artikels. Hier das Beispiel von Google.de

Die eigentlich inhaltlichen Treffer tauchen jedoch gar nicht mehr in der Trefferliste auf. Rankt man nun nach inhaltlicher Relevanz erhält man ein vollkommen anderes Ranking. Dass Wikipedia, als DIE online Enzyklopädie, nicht als Ergebnis erscheint liegt an der Gewichtung der inhaltlichen Treffer.In diesem Fall des Inhalts zum Thema Kosmetik. Der Gedanke liegt zwar jedem fern, aber ja, es kann Webseiten geben, die noch mehr Substanz aufweisen als Wikipedia  Siehe hier ein Screenshot vom Qimaya Entwicklungsserver.

Es bleibt natürlich jedem selbst überlassen, welche Ergebnisliste er favorisiert. Aber wir sind tatsächlich so verrückt zu glauben, dass der intelligente Nutzer nach Substanz sucht und nicht nur nach dem nächsten Angelhaken, der ihm das Geld aus der Brieftasche zieht.

Written by Qimaya

29. September 2008 at 2:08 pm

Neurosemantik. Warum?

with one comment

Qimaya wurde in den letzen Wochen häufig nach seinen technologischen Grundlagen gefragt. Wie funktionieren eure neurosemantischen Netze? Warum ist dieser Ansatz vielversprechender als andere Ansätze? Was bedeutet Neurosematik überhaupt?

Nun ist Qimaya nicht das Resultat einer gezielten technologischen Forschung. Es war nicht so, dass morgens ein Techniker aufgestanden ist mit den Worten: „Nu bauen wir uns eine Suchmaschine!“.

Qimaya bezieht seine Stärke aus langjähriger wissenschaftlicher Grundlagenforschung. Die 90er Jahre gelten als die „Dekade des Gehirns“, da in diesen Jahren erhebliche Mittel für Gehirnforschung bereitgestellt wurden. Zahlreiche Institute für Neuroinformatik entstanden in dieser Zeit.

Ich hatte die Ehre und das Vergnügen, vom April 1991 bis Dezember 2000 mit Prof. Dr. Dr. Olaf Breidbach (Universität Jena) wissenschaftlich zu arbeiten.

Soeben ist von Olaf Breidbach in der edition unseld das Buch „Neue Wissensordnungen. Wie aus Informationen und Nachrichten kulturelles Wissen entsteht“ erschienen.
Die edition unseld will „die Frage nach dem Für und Wider einer naturalistischen Weltsicht diskutieren, der durch Naturwissenschaft und Technologie bewirkte Wandel unseres Weltgefühls soll beschrieben, erklärt und vorausgedacht werden“.

Natürlich kann ich keine neutrale Rezension zu dem Buch schreiben, da ich zu sehr in das Thema involviert bin. Ich kann aber – zumindest was einzelne kleine Facetten des Buches anbelangt – als Zeitzeuge kommentieren. Empfehlen möchte ich das Buch aus drei Gründen.

1. Das Buch wird den Zielen der edition unseld in besonderer Weise gerecht. Olaf Breidbach – in Personalunion Neuroanatom und Philosoph – nennt die gesellschaftlichen Gefahren, die entstehen, wenn auf vernetztes Denken verzichtet wird. China-Politik, Bankenkrise und indirekt die aktuellen Probleme am Cern finden sich in seinem Text antizipiert. Das Vernetzungsparadigma aus den Neurowissenschaften dient im als „Kronzeuge“ zur Bewertung gesellschaftlicher Prozesse.

2. Es wird klar und deutlich, dass die Neurosemantik nicht aus einer Beliebigkeit heraus enstanden ist. Die biologische Plausibilität des Ansatzes war dabei nur ein Kriterium. Breidbachs Deutungsrepertoire umfasst die Kognitionsarchitektur eines Robert Fludd; mit spielerischer Leichtigkeit wird Hegels Logik eingebunden und nur wenige Absätze weiter befinden wir uns in einer pointierten Filmkritik zur Matrix-Trilogie. Das Buch selbst ist ein kleines Netzwerk. Und viele Knoten offenbaren ihre Semantik erst beim zweiten Lesen. Man sollte sich nicht auf die haptischen 182 Seiten einstellen, sondern seinem persönlichen Neuralnetz 364 Seiten Lektüre gönnen.

3. Das Buch eignet sich bedingt als Einstiegstext in eine Wissenschaft des vernetzten Denkens. Gleich am Anfang des Buches heisst es: „Es wird keine umfassende Wissens-Wissenschaft vorausgesetzt, die dann die Einzeldisziplinen bestimmt. Es wird vielmehr eine Vorgehensweise verfolgt, die Denkweisen der verschiedenen Disziplinen aufnimmt und ihre jeweiligen Argumentationsweisen integriert.“ Zu beachten sind natürlich die ausführlichen Anmerkungen mit Literaturhinweisen. Hervorheben möchte ich besonders das Buch „Deutungen“, das sich unter anderem mit der Konstitution und Bewertung von Wissensstrukturen befasst.

Vielleicht wird der Leser ja – frei nach Clinton – nach der Lektüre sagen:
„It’s interconnectedness, stupid“.

PS. Leider kann es passieren, dass man beim Surfen nach „neurosemantics“ auf Sekten und Scharlatane („NLP“) stößt. Die haben mit Wissenschaft so viel zu tun wie mein Bierbauch mit Adonis.

Autor: Klaus

Written by Qimaya

28. September 2008 at 7:17 pm

Veröffentlicht in Uncategorized

Die Qimayaner

with one comment

Damit ihr wisst über wenn hier überhaupt geschrieben wird. Dieses Foto wurde anlässlich Start2Grow aufgenommen. In der Wirklichkeit sind wir viel hübscher und schauen auch nicht so komisch, ehrlich! Das liegt am Licht äh und dem Wetter….

Quelle: Start2Grow

vol nach ur: Ralf Lensing, Josef Möllmann, Roy Uhlmann, Dr. Klaus Holthausen, Ulf Letschert, (Markus Ernsten konnte leider an diesem Tag nicht teilnehmen)

In den nächsten zwei Wochen lassen wir Qimaya-Fotos von uns machen. Stefan grübelt schon seit Wochen wie er uns so schön und jung darstellen kann, wie wir uns doch eigentlich fühlen.

Written by Qimaya

23. September 2008 at 7:54 pm

Veröffentlicht in Uncategorized

Tagged with ,

Foerderland

leave a comment »

Schön zu lesen, dass Foerderland.de die Gewinner, damit auch uns, mit einem Beitrag bedacht hat. Bisher war Förderland für uns nur eine Informationsseite auf der man von den Großen und Kleinen da draußen las. Umso schöner, dass Qimaya dort nun selbst genannt wird. Für das Team eine tolle Sache, denn es erzeugt für uns eine eigene Dynamik. Wir werden schneller, enthusiastischer, ja man könnte sagen jeder hier im Team überschlägt sich bald. Für Klaus geht die Arbeit noch besser von der Hand. Wir können also die Tage zählen bis wir online sind.

Written by Qimaya

23. September 2008 at 4:20 pm

Veröffentlicht in Uncategorized

Tagged with ,

Unglaublich, der 3. Platz bei Start2grow!

with 3 comments

Unglaublich, wir haben tatsächlich den 3.Platz beim Start2Grow Gründerwettbewerb erreicht! Nicht nur, dass der Wettbewerb nun 10.000 € in die klammen Taschen von Qimaya spült, nein ganz besonders freuen wir uns über die Prämierung als solche.

Für uns gibt es keine schönere Bestätigung! Denn es zeigt uns, wir werden auch von anderen nicht für verrückt gehalten, vielmehr für mutig in diesem Marktumfeld (böse Zungen behaupten auch Haifischbecken) eine vollkommen neuartige Suchmöglichkeit zu entwickeln. Das stärkt den Rücken!

Im Wettbewerb selbst zeigten wir einige Schwächen, wodurch die Platzierung für uns auch mehr als überraschend gekommen ist. Nachdem die ersten 7 Teams auf den 4. Platz prämiert wurden und wir nicht dazu gehörten war für uns klar, dass wir nicht in der Platzierung auftauchen werden. Tatsächlich diskutierte das Qimaya Team kurz die Alternative sich schon einmal um das Buffet zu kümmern, manche nennen es auch Frustessen!

Platz 3 führt hielten wir für unmöglich! Aber irgendwie muss die Jury wohl uns überzeugt gewesen sein. Schon das ist der größte Erfolg. Die Teilnehmer waren allesamt sehr technikgetriebene Unternehmen, mit zum Teil wirklichen interessanten Innovationen. Ich würde sagen die Zeit der Web 2.0 Ideen ist vorbei. Technik und Innovation steht wieder im Vordergrund.

Nachfolgend eine Übersicht der platzierten Teams mit Foto.

start2grow

1. Preis

Team Justaloud

2. Preis
Team ubigrate

3. Preis
Team Qimaya

4. – 10. Preis
Team barcoo
Team Diggi.Door
Team Parsolve
Team scholarz.net
Team studdex
Team treckpacker
Team Yolk

Written by Qimaya

23. September 2008 at 12:00 pm

Veröffentlicht in Uncategorized

Tagged with

Qimaya Technologie: Unkaputtbares SEO?

with 2 comments

Neulich gab es einen sehr interessanten Kommentar zu unserer Suchtechnologie. Es wurde die These aufgestellt, dass unsere assoziativen Netze dazu führen könnten, dass SEO eines Tages überflüssig wird.

Leider kann ich diesen Optimismus nicht ganz teilen.

Grundsätzlich ist richtig, dass durch SEO die Grundphilosophie des Pagerank-Vefahrens – also der Technologie des Marktführers – konterkariert wird. Ich habe auf dem SuMa-Ev Kongress 2007 in Berlin detailliert geschildert, welche Auswirkung eine Überoptimierung des Pagerank-Verfahrens hat:

Die Kernaussage meines damaligen Vortrags kann man so zusammenfassen: Die Pagerank-Reichen werden immer reicher und die Pagerank-Armen werden immer ärmer.

Interessanterweise kam nach dem Vortrag der Inhaber einer SEO-Firma auf mich zu und meinte, ich hätte „ihm die Augen geöffnet“. Mit anderen Worten: Die Präsentation meiner Analyse führt als Erstes dazu, dass eine neue Runde im Hase-und-Igel-Spiel zwischen Marktführer und SEO-Firmen eingeleitet wird. Konkret: Wer die neuesten Patente des Marktführers berücksichtigt, hat im SEO-Spiel die Nase vorn.

Die Logik verlangt aber, dass man dieses Spiel nicht beliebig weitertreiben kann. Wie wird die Internet-Welt in zehn Jahren aussehen?

1. Die Zahl der Nutzer des Internet nimmt stetig zu. Dies betrifft insbesondere auch die Altersgruppe der über 50jährigen.

2. Die Möglichkeit der Effizienzmessung bei Werbeformen wie Adwords macht diesen Marketingkanal auch in Rezessionszeiten attraktiv und kalkulierbar.

3. Bei den Jüngeren nimmt der Medienwechsel vom Fernsehen zum Internet zu.

4. Weitere mittelständische Firmen entdecken das Internet als Werbemedium.

Schon heute hat der Markt für Online-Werbung ein geschätztes Jahresvolumen von 3,7 Milliarden Euro.

Es wird also ganz sicher auch in zehn Jahren das Bestreben geben, eine Internetseite aus wirtschaftlichen Gründen prominent zu platzieren. Es wird auch in zehn Jahren SEO geben.

Nur: Unser Ansatz stellt eine größere Chancengleichheit her. Es gilt die Formel: Content vor Prominenz. Der Wettbewerb zur „Hommingberger Gepardenforelle“ hat bereits gezeigt, dass Content auch heute schon ein wichtiger Faktor bei der Bewertung einer Website ist.

Bei uns kann Content nicht durch eine Verlinkung künstlich gepushed werden.

Im besonderen Maße werden die Redakteure von Online Zeitungen profitieren, denn ihre Aufgabe wird wieder mehr mit der Erstellung eines fundierten redaktionellen Beitrages verbunden sein, anstatt sich vom hauseigenen SEO gängeln zu lassen ihren Beitrag in eine bestimmte von Suchmaschinen auffindbare Struktur pressen zu lassen. So wird auch eine Suchmaschine wieder ein Recherchetool anstatt ein Verzeichnis der prominentesten Webseite.

SEO in zehn Jahren wird vielleicht stärker durch Serviceleistungen geprägt sein: Reichhaltigen und relevanten Content zu einem Produkt bereitstellen. Wer zum Beispiel Wein über das Internet vertreiben will, kann reichhaltige Informationen über die Herkunftsländer ins Netz stellen. Letzten Endes kann daraus eine stärkere Differenzierung entstehen. Wer etwa Rotwein aus Frankreich sucht, wird in den Trefferlisten genauer auf das relevante Thema geführt. Im Idealfall haben wir einen informierten User und für die Wirtschaft lohnende Conversion Rates.

Wer damit nicht zufrieden ist, dem sei dann doch eine Möglichkeit genannt, SEO zu beenden:

Das Internet abschalten!

Autor: Klaus

Written by Qimaya

21. September 2008 at 8:22 pm