Dateien zu dieser Seite

Handout

Vortrag

Doktoranden- und Forschungsseminar des Lehrstuhls Betriebliche Informationssysteme

Entwicklung und Evaluation von Caching-Strategien für Anfragen an RDF-Triple-Stores


  • Autors: Torsten Hein (soz04aif@studserv.uni-leipzig.de)
  • Vortragender: Torsten Hein
  • Termin: 06.07.2006
  • Stichwörter:

Abstract

Ziel der Arbeit ist einerseits die Implementierung eines Caching-Tools für RDF-Triples-Stores und andererseits ein umfangreicher und detaillierter Test durch ein ausführliches und realistisches Benchmark-Szenario. Die zunehmende Verbreitung und Entwicklung des Semantic Web führt zu wachsenden RDF-Wissensbasen, die vermehrt in produktiven Anwendungen zum Einsatz kommen. Damit steigt der Bedarf an leistungsfähigen Tools zur Verwaltung dieser RDF-Triple-Stores, um die Daten darstellen, bearbeiten und suchen zu können. Da die Anfrage und Zusammenstellung der Daten für die Präsentation häufig ein zeit- und kostenintensiver Prozess ist, kann der Einsatz von Caching-Strategien die Reaktionszeit der Anwendungen beschleunigen und gleichzeitig den Rechenaufwand der Datenserver verringern. Dafür soll nun ein Caching-Tool entwickelt werden, das bereits angeforderte Daten zwischenspeichert und bei erneuter Anfrage bereitstellt. Entscheidend für den Aufbau des Caches ist dabei die Erstellung eines Kostenmodells in Hinblick auf: Dauer für Speichern und Laden der Daten im Cache verglichen mit der direkten Datenabfrage, Häufigkeit der Anfrage, Aufwand der Cache-Reorganisation bei Update-Operationen auf der Datenbasis und weiteren Aspekten. Bei Veränderungen der Datenbasis sollen möglichst auch nur die Bereiche des Caches aktualisiert werden, die wirklich von Update-Operationen betroffen sind. Zur Umsetzung dieser Ziele sollen die Ideen aus [1] aufgegriffen und weiterentwickelt werden. Besonderes Augenmerk liegt auf der praktischen Überprüfung des theoretischen Kostenmodells. Dafür gilt es, ein realistisches Testszenario zu entwickeln, das die Vorteile und Leistungsfähigkeit der Caching-Strategien anhand von objektiven und überprüfbaren Benchmark-Ergebnissen darstellt. Bisher existieren noch keine standardisierten und verbreiteten Benchmark-Suiten für Systeme, die RDF/S und OWL Wissenbasen verwalten. Das zu entwickelnde Testszenario soll sich an den Arbeiten von [4] und [7] orientieren.

References


[1] Auer, S.: Caching and Invalidation for Querying Triple Stores. Unpublished.
[2] Chidlovskii, B.; Borgho, U.M.: Semantic caching of web querie. VLDB Journal, 9(1), pages 2–17, 2000.
[3] Dar, S.; Franklin, M. J.; Bjoern Joensson; Divesh Srivastava; Michael Tan.: Semantic data caching and replacement. In Proceedings of VLDB'96, pages 330–341, 1996.
[4] Guo, Y.; Pan, Z. & Heflin, J.: LUBM: A Benchmark for OWL Knowledge Base Systems. In Journal of Web Semantics, 3(2), pages 158–182, 2005.
[5] Ren, Q.; Dunham, M.H.; Kumar, V.: Semantic caching and query processing. IEEE Transactions on Knwoledge and Data Engineering, 15(1), January / February 2003.
[6] Tempich, C. & Volz, R.: Towards a benchmark for Semantic Web reasoners – an analysis of the DAML ontology library. In Workshop on Evaluation on Ontology-based Tools, ISWC2003.
[7] Wang, S.; Guo, Y.; Qasem, A. & Heflin, J.: Rapid Benchmarking for Semantic Web Knowledge Base Systems. Computer Science and Engineering Department, Lehigh University, Technical Report LU-CSE-05–026, 2005.
[8] Wilkinson, K.; Sayers, C; Kuno, H.; Reynolds, D: Efficient RDF Storage and Retrieval in Jena 2. In Proceedings of VLDB Workshop on Semantic Web and Databases, pages 131–150, 2003.


Forschungsseminar



 
Zu dieser Seite gibt es 2 Dateien. [Zeige Dateien/Upload]
Kein Kommentar. [Zeige Kommentare]