Praktikum Semantic Web
Sören Auer, Frank Loebe, Thomas Riechert, Jens Lehmann und Sebastian Tramp
Modul: Semantic Web
Organisatorisches
Je nach Teilnehmerzahl werden die Praktikumsaufgaben einzeln oder in Zweier-Gruppen vergeben.
Themengebiete
Ontology Learning Benchmarks (Mehrere Themen)
Studenten: Lorenz Bühmann, Christoph Kämpf (weitere möglich)
Inhalt der Aufgabe ist die Anwendung von DL-Learner auf Machine Learning Benchmarks mit vorheriger Konvertierung der Daten in eine OWL-Ontologie. Ziel ist hier die Modellierung in OWL ausgehend von realen Daten zu üben. Darauf basierend soll ein Machine Learning Verfahren angewandt werden und die Resultate mit anderen (nicht auf OWL basierenden) Verfahren verglichen werden. Kenntnisse zu OWL werden innerhalb von Vorlesung und Seminar vermittelt. Vorherige Kenntnisse im Machine Learning Bereich oder der jeweiligen Problemdomäne sind hilfreich, aber nicht notwendig. Folgende Probleme stehen zur Auswahl, wobei auch frei weitere vorgeschlagen werden können:
- Mutagenese (Prolog-Parser im DL-Learner vorhanden)
- Arzneimittel für Alzheimer-Patienten
- Suramin-ähnliche Substanzen zur Krebsbekämpfung
- Vorhersage von Proteinstrukturen [Interesse: Christoph Kämpf]
- Schach-Endspiele 1, 2, 3, 4, 5, Nalimov Tabe Bases [Interesse: Lorenz Bühmann]
- Finite-Elemente-Methode (FEM)
- Energieversorgungsprobleme in Satelliten
- U-tube Problem
- Natural Language Processing (eins der dortigen Probleme wählen)
- Lymphographie
- Flaggen
Ein Beispiel für ein bereits ausgeführtes Projekt zur Erkennung von krebserregenden Substanzen:
Automatische Produktklassifizierung mit Semantic Web Technologien
Studenten: Jonas Brekle
Inhalt der Aufgabe ist eine typische Produktklassfizierungsaufgabe zu lösen. Hierzu sollen neuere Semantic Web Technologien ( DL-Learner ) mit bestehenden Machine Learning Verfahren verglichen werden.
Da die Daten im tsv-Format bereitgestellt werden, besteht die erste Teilaufgabe des Praktikums darin, Sie in ein geeignetes Semantic Web format (RDF/OWL) upzugraden. Danach kann eine Anreicherung aus folgenden externen Wissensquellen vollzogen werden:
Mit Hilfe der angereichten Ontologie und dem DL-Learner soll nun versucht werden die Klassifikationsaufgabe bestmöglich zu lösen. Das Ergebnis soll weiterhin mit Ergebnissen von Off-the-Shelf Machine Learning Software Rapid Miner verglichen werden.
SPARQL Trainer Extension (Mehrere Themen)
Inhalt dieser Aufgabe ist die Erweiterung des bestehenden SPARQL Trainers um «pädagogische» Aspekte. Der SPARQL Trainer wurde im Rahmen des letzten Semantic Web Praktikums (2009) geplant, implementiert und getestet. Der derzeitige Stand der Implementierung ermöglicht zwar eine Abarbeitung eines definierten Fragenkataloges auf konfigurierten RDF-Graphen, unterstützt derzeit allerdings nur ein rudimentär umgesetztes Benutzer-Feedback. Der SPARQL Trainer soll in zukünftigen Lehrveranstaltungen zum Semantic Web zum Einsatz kommen, was allerdings eine Erweiterung / Implementierung des Benutzer-Feedbacks voraussetzt. Zusätzlich zu diesem wichtigen Feature ist eine Erweiterungen um SPARUL (SPARQL Update Language) ein mögliches Thema. Falls eigene Vorschläge zur Verbesserung des SPARQL Trainers existieren, können diese ebenfalls besprochen werden.
xOperator Weiterentwicklung
Studenten:
Der xOperator ist ein chat-basierter Semantic Web agent. Auf Basis von AIML-templates setzt er natürlich sprachliche Fragen auf SPARQL und verteilt diese in dem chat-inhärenten sozialen Netzwerk. Es ist dabei folgendes Szenario geplant:
- Portierung des Agenten auf Android
- Konvertierung von Daten aus der Laufzeitumgebung (Ort, Kontakte, Status, ...)
- Definition eines Use Cases
- Erstellung von Skripten zur Abfrage dieser Daten aus dem lokalen und aus den verteilten Stores
Gerne könenn auch eigene Vorschläge gemacht werden.
Inhaltliche Schwerpunkte sind damit neben den in der Vorlesung vorgestellten Technologien wie RDF und SPARQL das Chatprotokoll XMPP und allgemeine Webtechnologien. Der xOpertor ist in Java geschrieben.
Onto Wiki Erweiterungen (Mehrere Themen)
Onto Wiki ist ein browserbasierte Werkzeug, welches kooperatives und agiles Wissensmanagement nach Art eines Wikis unterstützt. Die vom Onto Wiki verwalteten Wissensbasen lassen sich sowohl in einer Vielzahl von Sichten erkunden und betrachten, als auch bearbeiten. Onto Wiki ist ein in PHP geschriebenes Open Source Projekt, welches mittlerweile in Version 0.9.5 RC1 verfügbar ist.
Für die folgenden Praktikumsthemen sind Kenntnisse in PHP notwendig.
Diskussionen über RDF Ressourcen
Studenten:
Die Onto Wiki Community-Komponente ermöglicht die Disskussion über Ressourcen in einer Datenbasis, welche innerhalb des RDF Modelles als SIOC Posts gespeichert werden. Diese Posts werden zeitlich geordnet für eine einzelne Ressource dargestellt.
Folgende Erweiterungen sind für die Community-Komponente sinnvoll:
- Nutzer sollten die Möglichkeit haben, sich auf andere Kommentare zu beziehen (Thread)
- Nutzer sollten die Möglichkeit haben, alle Kommentare zu eine Liste von Ressourcen oder für eine komplette Wissensbasis zu sehen
Eine erfolgreiche Erweiterung der Community-Komponente ermöglicht die praktische Erfahrung mit folgenden Themen:
- Modellierung von RDF Wissen mit den Vokabularen SIOC, FOAF und Dublin Core
- Manuelle Abfrage von RDF Modellen mit SPARQL
- API gestützte Abfrage von RDF Modellen
Dieses Thema ist auch für eine Gruppe von bis zu zwei Studenten geeignet.
Kalender Export
Studenten: Jan Baumgarten, Nico Patitz
Onto Wiki ermöglicht die Verarbeitung von generischen RDF Daten. Eine bekannte und wichtige Art von Daten sind Kalender-Daten im iCal Format. Ziel diese Themas ist eine Export-Erweiterung für Onto Wiki, welche es ermöglicht zu einer gegebenen Liste von Ressourcen bzw. zu einem kompletten RDF Modell, einen iCal Export zu erzeugen, welcher z.B. in den Google Kalender oder in Desktop Applikationen eingebunden werden kann.
Eine erfolgreiche Erweiterung der Community-Komponente ermöglicht die praktische Erfahrung mit folgenden Themen:
- Manuelle Abfrage von RDF Modellen mit SPARQL
- API gestützte Abfrage von RDF Modellen
- Modellierung von RDF Wissen mit verschiedenen Vokabularen
Dieses Thema ist auch für eine Gruppe von bis zu zwei Studenten geeignet.
Manchester OWL Syntax Parser
Studenten: Rolland Brunec
Ziel dieses Themas ist die Entwicklung eines PHP basierten Manchester OWL Syntax Parsers für den Einsatz innerhalb Onto Wikis.