Qimaya – Semantic Web

creating a semantic web

Zittau ist oben! Inhaltliche Dubletten bleiben, vorerst!

leave a comment »

Unser letztes Update in diesen Tagen. Die Zittau-Version ist da!

Was enthält sie? Weitere gecrawlte Seiten, und eine Ergänzung der Suchwörter. Letztlich ist dies an ihr gar nicht so interessant, sondern vielmehr die Beseitigung einiger genereller Bugs, die uns in dieser ersten Prototyp-Phase beschäftigten.

Keine Bugs sind allerdings die inhaltlichen Dubletten. Bei der Menge der Dubletten je URL, teilweise bis zu 7 Dubletten zu einem Artikel, und der Anzahl der gecrawlten Seiten macht es einfach keinen Sinn mehr jeder Dublette auf den Grund zu gehen. Daher widmen wir uns nunmehr auch einem intelligenten Dublettenerkenner. Es würde letztlich zuviel Zeit kosten diese manuell zu identifizieren und zu bereinigen. Daher dieser notwendige Schritt.

Was will ich damit sagen? Wir sind uns des Problemes bewusst und möchten euch daher vorerst bitten über die Dubletten hinwegzusehen. Die Technik ist erklärt, Phase 2 folgt.

Wie ihr sicherlich schon „gehört“ habt wird Zittau nicht sehr lange eine Rolle spielen. Dazu jedoch im nächsten Beitrag mehr, samt Ausblick, Einblick und Rundblick😉

Written by Qimaya

17. Dezember 2008 um 3:30 pm

Veröffentlicht in Uncategorized

Schreibe einen Kommentar

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s

%d Bloggern gefällt das: