Archiv für Dezember 17th, 2008
Was passiert auf Qimaya, heute und in naher Zukunft?
Qimaya = Semantik?
Was machen wir eigentlich?
Qimaya hat durch die Emulation des menschlichen Gehirns einen Algorithmus entwickelt, welcher die Bedeutung respektive den Informationsgehalt von Daten erkennen kann. Eine Menge Technik, mit welcher ich euch gar nicht langweilen möchte. Nur kurz sei erwähnt, dass der Algorithmus mittels künstlicher Intelligenz in einem neuronalen Netz Daten so erkennt wie das menschliche Gehirn und diese somit auch intelligent verknüpfen kann. Hierdurch entsteht der Zustand von Semantik. Ich will dies gar nicht erklären, vielmehr verweise ich mit warmen Wallungen meines Herzens auf Martin Waiss und XiongShui.
Können das nicht viele?
Nö.
Un nu?
Tja, wer zum Mond fliegen will, der muss eine Rakete bauen. Das ist letztlich auch gar nicht unrealistisch, wenn man die Technik hat. Doch was will man dort, in unserem Fall, welchem Dienst kann man mit dieser Technik Konkurrenz machen?
Die Frage ist, will man überhaupt Konkurrenz machen? Oder springt man lieber ins kalte Wasser und macht einmal etwas ganz Neues?! Wer hat schon Lust auf eine copy cat Diskussion auf Techcrunch.
Sind wir doch mal ehrlich. Suche wie Yahoogle, nur eben semantisch? Joa, ganz nett, aber bringt das wirklich etwas, wird man einen solchen Markt erobern können? Wie anders muss man sein, um anders zu sein?
Deshalb…
haben wir uns ein paar Gedanken gemacht. Und hierbei danke ich besonders auch Rudy und Timon, unseren geistigen Sparringspartner. Um Anwendungen, User Need, Monetarisierung und die Entwicklung des Webs. Zur Anwendung von Semantik sagt Martin folgendes. Eine Anwendung von Semantik ist also weniger Suche als vielmehr die Obsoletierung von Suche. Unser Prototyp war eine Suchmaschine, der Schock wäre sonst zu groß. Ab Weihnachten geht der Prototyp zurück ins Labor, wird auseinander geschraubt und für das eigentliche Ziel im Frühjahr 2009 wieder online sein.
Die Erstellung des semantischen Webs ist das eigentlich Ziel!
Heißt?
Wir entwickeln eine Basisplattform, welche die Daten von Webseiten zusammenführt, semantisch aggregiert. Die Plattform wird zugleich Basisplattform für das semantische Web und dessen Anwendungen.
Das Web wird sich von diesem Zustand…
zu diesem ändern.

Glaubt ihr ernsthaft wir posten hier, was jeder gerne kopieren würde, hehe…
Geschäftsmodell?
Wuhaaa, eine Debatte vor der sich jeder scheut. Im Zweifel eben Werbung…
Nö, dafür sind wir zu intelligent, dann erfinden wir lieber eine neue Monetarisierungsform für das WWW.
Data as a currency!
Das semantische Web ist ein Network von Webseiten, damit auch deren Daten. Diese haben einen umsatzimmanenten Wert. Man kann Daten nutzen für den Ecommerce sowie jegliche kommerziellen Anwendungen. Ein semantischer Datenfluss schafft Wertschöpfung, wenn man Daten intelligent miteinander verknüpfen kann.
Betrachten wir das Thema Daten von einer anderen Seite, so erkennen wir, dass es Milliarden von Daten im Netz gibt, die so gerne monetarisiert werden wollen. Sogar überhaupt erst aus einem umsatzimmanenten Interesse erstellt wurden. Dies sollte man sich einmal auf der Zunge zergehen lassen. Ein sehr sehr großer Markt, bei 50,5 Mio Domains!!!
Doch nun in medias res, wie können die Daten von Webseiten monetarisiert werden, als Data as a currency?
Derzeit besteht das WWW aus Insellösungen von Webseiten. Jede Insel repräsentiert einen Inhalt, einen Anbieter, eine Anwendung. Im Detail gibt es eine Vielzahl von Kommentaren, Beiträgen, Bildern zum gleichen Thema oder Produkt, verteilt über das ganze Netz. Wenn wirkliche Semantik entsteht, also keine Behelfslösungen wie Ontologien oder dergleichen, so ist es möglich alle diese Inseln intelligent miteinander zu verknüpfen. D.h. uns interessieren nur noch Inhalte oder Produkte, nicht mehr Domains. Jegliche Daten zu einem Thema bzw. einem Inhalt oder Produkt kann eine semantische Lösung selbstständig am Point of Interest verknüpfen. Inhalte oder Produkte werden also aufgewertet, durch „Daten“ wie Bewertungen, Kommentare, textuelle Beiträge etc…….. die im Netz verfügbar sind.
Daten können also als förderndes Mittel Teil des Wertschöpfungsprozesses werden. Genau so wie wir in unseren Blogs Videos embedden. Und genau jetzt werden Daten zur Währung.
Eine intelligente semantische Verknüpfung erstellt eine Art semantischen Data Flow im semantischen Web. Daten werden intelligent getauscht. Das Prinzip des Give´n Take.
Wann passiert nun was?
Ihr findet seit 10 Jahren Google super, dann machen die paar Monate auch nichts aus. Im Frühjahr 2009 werden wir zuerst mit unsem Basisportal zeigen wie man Inhalte als semantisches Mashup aggregiert.
Im zweiten Schritt passiert folgendes…

Und im dritten Schritt sollten wir alle daran arbeiten, dass wir es endlich schaffen, die mit viel Mühe auf unseren Webseiten geschaffenen Inhalte (Daten) zu monetarisieren.
Und damit kommen wir über kurz oder lang dorthin wo Martin Semantik in seiner Reinform sieht.
Was passiert dann mit der Suche?
Ich denke es gibt genug Firmen, die sich der Suche, wie wir sie heute z.B. in der Suche nach einer Webseite kennen, annehmen werden. Besonders hohe technologische Fortschritte sind hierbei nicht notwendig und Google wird beim Thema Suche sowieso niemand vom Thron stoßen.
Zittau ist oben! Inhaltliche Dubletten bleiben, vorerst!
Unser letztes Update in diesen Tagen. Die Zittau-Version ist da!
Was enthält sie? Weitere gecrawlte Seiten, und eine Ergänzung der Suchwörter. Letztlich ist dies an ihr gar nicht so interessant, sondern vielmehr die Beseitigung einiger genereller Bugs, die uns in dieser ersten Prototyp-Phase beschäftigten.
Keine Bugs sind allerdings die inhaltlichen Dubletten. Bei der Menge der Dubletten je URL, teilweise bis zu 7 Dubletten zu einem Artikel, und der Anzahl der gecrawlten Seiten macht es einfach keinen Sinn mehr jeder Dublette auf den Grund zu gehen. Daher widmen wir uns nunmehr auch einem intelligenten Dublettenerkenner. Es würde letztlich zuviel Zeit kosten diese manuell zu identifizieren und zu bereinigen. Daher dieser notwendige Schritt.
Was will ich damit sagen? Wir sind uns des Problemes bewusst und möchten euch daher vorerst bitten über die Dubletten hinwegzusehen. Die Technik ist erklärt, Phase 2 folgt.
Wie ihr sicherlich schon „gehört“ habt wird Zittau nicht sehr lange eine Rolle spielen. Dazu jedoch im nächsten Beitrag mehr, samt Ausblick, Einblick und Rundblick










