Tom-Michael Hesse: Entwicklung eines Werkzeuges für die visuelle Exploration von semantisch annotierten, statistischen Daten im Onto Wiki- Framework unter Nutzung eines Service für statistische Auswertungen und einer Komponente zur grafischen Darstellung (Masterarbeit)


Im World Wide Web finden sich eine Vielzahl von Datensammlungen, deren Erkundung und Auswertung mit hohem Aufwand für den Benutzer verbunden ist. In der Regel ist dafür die Bestimmung von Auswertungskriterien sowie die geeignete Anfertigung von grafischen Repräsentationen anhand einer dem Betrachter implizit bekannten Semantik erforderlich. Dabei lassen sich große Datenmengen oft nur anhand einer Visualisierung praktikabel und leicht verständlich zugänglich machen, die sich nicht immer sinnvoll automatisch generieren lassen.


Ziel dieser Arbeit ist die Entwicklung eines Werkzeuges zur visuellen Exploration solcher Datenmengen anhand eines mehrstufigen, semi-automatischen Verfahrens im Onto Wiki- Framework für semantische Daten. Zunächst muss dafür eine Sammlung statistischer Daten semantisch annotiert und in ein für die weitere Verarbeitung geeignetes Vokabular übersetzt werden. Insbesondere sind dabei die Eigenschaften von Data Ware Houses interessant, die ihren Datenbestand in Cubes entlang verschiedener Dimensionen strukturieren. Dies kann etwa mit dem RDFDataCube-Vokabular erreicht werden, wobei der semantische Kontext der ursprünglichen Daten erhalten bleibt, was gegenüber klassischen Data Ware Houses einen erheblichen Vorteil in der Erkennung von Datenabhängigkeiten bietet, die nun explizit erschließbar sind. Danach werden die so aufgearbeiteten Daten durch einen Service für Statistik ausgewertet. Anhand von konkreten Anfragen oder allgemeinen Auswertungswünschen des Nutzers können dabei anhand der semantischen Annotation Datenaggregationen vorgenommen werden, die sich an bestehenden Abhängigkeiten oder Zusammenhängender Daten orientieren. Insbesondere kann dem Nutzer dadurch eine Vorauswahl geeigneter Darstellungen angeboten werden, die neben generischen Aspekten auch eine Heuristik aus bisher erfolgten und bewerteten Anfragen anderer Nutzer berücksichtigt. Die Datenauswertung erfolgt dabei vor allem deshalb im Rahmen eines Service, da so keine Bindung der Auswertungsergebnisse an die Darstellungsoberfläche vorliegt. Dadurch können auch Anwendungen außerhalb des Onto Wiki- Frameworks Anfragen an diesen Service stellen, was das Potential möglicher Nutzungen erheblich vergrößert.
In einem letzten Schritt werden die vom Service bereitgestellten aggregierten Daten in Diagramme eines passenden Typs umgesetzt, die in einem Mash Up auf eine Karte aufgebracht werden. So wird die vom Benutzer angeforderte Auswertung entlang
spezifischer Dimensionen visualisiert – und die Daten werden explorierbar. Ein intuitiver Zugang soll gerade bei komplexen Anfragen etwa über vier Dimensionen erreicht werden, da die Einbettung von Diagrammen in Karten eine leicht verständliche und dennoch zielgenaue Aufbereitung der Auswertungsergebnisse verspricht. Insgesamt sollen mit dieser Methodik große statistische Datensammlungen für den Benutzer leicht bedienbar und verständlich explorierbar werden, indem Anfragen auf
diesen Daten semi-automatisch in kontextbezogenen Diagrammen auf einer entsprechenden Karte aufbereitet und dargestellt werden.


Ansprechpartner: Michael Martin


 
Zu dieser Seite gibt es keine Dateien. [Zeige Dateien/Upload]
Kein Kommentar. [Zeige Kommentare]