Praktikum Semantic Web

Sören Auer, Frank Loebe, Lorenz Bühmann, Jens Lehmann, Michael Martin, Sebastian Hellmann und Axel Ngonga


Modul: Semantic Web

Organisatorisches


  • Präsenzveranstaltungen: Auftakt (12.04.); Zwischenpräsentation (03.05.); Endpräsentation (05.07.)
  • Individuelle Zusammenarbeit in Absprache mit den Betreuern
  • Praktikumsbericht in Form einer Online Publikation (Wiki, Issue-Tracker, ggf. Source-Code) und Endpräsentation (20 min)
  • Zwischenbericht: Ständige Aktualisierung der Online Publikation und Zwischenpräsentation (10 min)
  • Repository: Individuell, z.B. Bitbucket
  • Bewertungskriterien: Erfolgreiche Präsentation.
  • Je nach Teilnehmerzahl werden die Praktikumsaufgaben einzeln oder in Zweier-Gruppen vergeben.

Themengebiete

Inhalt

Link Discovery für das Web of Data

Betreuer: Axel Ngonga, Daniel Gerber
Studenten: Haselhof / Schmidt

Ziel dieser Aufgabe ist die Anwendung der Link Discovery Frameworks LIMES und SILK2.3 für die Entdeckung von Links in der Linked Open Data Cloud. Links machen zur Zeit weniger als 2% der Triples im Linked Data Web aus. Sie spielen jedoch eine zentrale Rolle bei vielen Aufgaben wie Cross-Ontology Question Answering und Large-scale Inferencing. Ihre Aufgabe besteht aus folgenden Subtasks:

  1. Finden Sie mit Hilfe von Diensten wie CKAN 2 Paare von Wissensbasen, die zu verlinken wären (z.B. 2 Wissensbasen, die Medikamente beschreiben und 2 Wissensbasen, die Vogelarten enthalten). Insbesondere sollen mindestens ein Paar von Wissensbasen gefunden werden, die über den Abgleich von mindestens 2 Properties (z.B. Name und Hersteller bei Medikaments) verlinkt werden müssen.
  2. Erstellen Sie äquivalente LIMES und SILK Konfigurationen für das Verlinken dieser Wissensbasen.
  3. Führen Sie beide Linking-Experimente jeweils fünf mal aus.
  4. Dokumentieren Sie die Laufzeiten beider Werkzeuge (Mittelwert, Standardabweichung, min, max) und die Kosten der atomaren Operationen.
  5. Überprüfen Sie pro Experiment 100 zufällig ausgewählte Links manuell und berechnen Sie die Precision und den Recall der Werkzeuge.
  6. Erarbeiten Sie eine mögliche Strategie zur Ararbeitung komplexer Konfigurationen.

Eclipse Sparql-Query-Editor Plugin

Betreuer: Claus Stadler
Studenten: noch nicht vergeben

Visuelle und formularbasierte Sparql-Query-Builder Werkzeuge ermöglichen Sparql-unkundigen Nutzern das Erstellen von Anfragen an Triple Stores. Für IDE-verwöhnte Entwickler sind solche Werkzeuge allerdings nur von begrenztem Wert. Ziel dieser Aufgabe ist die Konzeption und Implementierung eines Sparql-Query-Editor Plug Ins für Eclipse, welches folgende Anforderungen erfüllen soll:

  • Syntax highlighting von Syntaxelementen wie Schlüsselwörtern, URIs und Variablen.
  • Auto-Completion: Variablennamen, zuletzt verwendeten URIs/Literale, Vorschläge aus vorkonfigurierten Triple-Stores.

Ontology Learning Benchmarks (Mehrere Themen)

Betreuer: Lorenz Bühmann
Studenten: Christoph Kämpf (weitere möglich)

Inhalt der Aufgabe ist die Anwendung von DL-Learner auf Machine Learning Benchmarks mit vorheriger Konvertierung der Daten in eine OWL-Ontologie. Ziel ist hier die Modellierung in OWL ausgehend von realen Daten zu üben. Darauf basierend soll ein Machine Learning Verfahren angewandt werden und die Resultate mit anderen (nicht auf OWL basierenden) Verfahren verglichen werden. Kenntnisse zu OWL sind erforderlich, d.h. müssen entweder vorhanden sein oder in der Vorlesung erworben werden. Vorherige Kenntnisse im Machine Learning Bereich oder der jeweiligen Problemdomäne sind hilfreich, aber nicht notwendig. Folgende Probleme stehen zur Auswahl, wobei auch frei weitere vorgeschlagen werden können:

Ein Beispiel für ein bereits ausgeführtes Projekt zur Erkennung von krebserregenden Substanzen:

Lernen von Regular Expressions

Betreuer: Sebastian Hellmann
Studenten: bis zu zwei Studenten, noch ein Platz frei (Toni Fröschke)

Zu Beginn des Praktikums soll eine OWL Ontologie erstellt werden, mit der man verschiedene Ausdrücke von Regular Expressions hierarchisch darstellt. Zum Beispiel ist '.*' eine Obermenge von '[a-z]*'. Danach sollen Trainingsbeispiele mit Hilfe von Regex gesucht werden, (z.b. Überschriften in Wiki Syntax), welche dann als Grundlage dienen mit dem DL-Learner OWL Beschreibungen von Regulären Ausdrücken zu lernen:


Aus den Postiven Beispielen:

====Link Discovery für das Web of Data====
====Ontology Learning Benchmarks (Mehrere Themen)====
====Lernen von Regular Expressions ====
====Erstellen von Statistik Tools für RDF und Anwendung auf Wikipedia/DBpedia ====
====SPARQL Trainer Extension (Mehrere Themen)====
====Semantischer Android Client for Communities ====
====OntoWiki Erweiterungen (Mehrere Themen)====


und den negativen:

=====Development of a Semantic Web Extension for poll execution based on RDF Questionnaire's=====
=====Diskussionen über RDF Ressourcen=====
=====Flash Visualisierung=====
==Praktikum Semantic Web==
=== Organisatorisches ===
===Themengebiete===
{{toc from="h3"}}

wird durch den folgenden Reg Ex erkannt, der aus den Beispielen gelernt werden soll:


grep   "^====[^=].*===="


Interessant wird herauszufinden inwieweit sich Reg Exe hierarchisch mit einer OWL Ontologie darstellen lässt, ganz
abdecken kann man es vermutlich nicht.

Erstellen von Statistik Tools für RDF und Anwendung auf Wikipedia / D Bpedia

Betreuer: Sebastian Hellmann
Studenten: bis zu zwei Studenten, noch ein Platz frei (Tanh Nghia Lam)

Ziel des Praktikums ist das Erstellen einer kleinen Tool Suite zum Vermessen von RDF Wissensbasen und deren Anwendung auf DBpedia.

  1. Bestehende Statistikmaße sollen recherchiert und evaluiert werden. Es soll überprüft werden, ob diese auf RDF (Labeled Directed Graphs) anwendbar sind. Mögliche Einstiegspunkte sind: Cluster Koeffizient, HITS, In / Outdegree, Graph Durchmesser, link
  2. Anwendbare Maße sollen implementiert werden, am Besten mit Unix Shell Skripten, AWK Beispiel für In/Outdegree, SPARQL und My SQL.
  3. Anschliessend sollen die Statistiken auf http://dbpedia.org angewendet werden und mit Gnuplot visualisiert.

Einsatz von Exhibit und SPARQL

Betreuer: Sebastian Hellmann
Studenten: Robert Schulze

Exhibit soll SPARQL kompatibel werden. Hierfür muss ein einfacher Transformator geschrieben werden, der ein JSON SPARQL Result Set in ein Exhibit JSON format konvertiert.
Es können auch Komponenten wieder verwendet werden: http://www.delicious.com/kurzum/exhibit
Ziel ist die Erstellung einer Exhibit Ansicht für einen existierenden SPARQL endpunkt.

Konvertierung des Deutschen Wortschatzes nach RDF 

Betreuer: Sebastian Hellmann
Studenten: frei

Das Projekt Deutscher Wortschatz soll mittels eines Skriptes nach RDF konvertiert werden. Es existiert bereits ein Schema und ein Datenformat. Die Konvertierung ist sehr einfach, da sich die Aufgabe auf die Anwendung beschränkt. Man kann hier sehr gut Basiskenntnisse in SQL und RDF erlernen.


SPARQL Trainer Extension (Mehrere Themen)

Betreuer: Daniel Gerber
Studenten: noch nicht vergeben

Inhalt dieser Aufgabe ist die Erweiterung des bestehenden SPARQL Trainers (Projektseite). Der SPARQL Trainer wurde im Rahmen des Semantic Web Praktikums (2009) geplant, implementiert (Java) und getestet. Das Tool wurde im Semantic Web Praktikum (2010) um ein umfangreiches Benutzerfeedback erweitert. Der SPARQL Trainer soll in zukünftigen Lehrveranstaltungen zum Semantic Web Modul zum Einsatz kommen. Zu den diesjährigen Aufgaben gehören:


  • Erstellen eines Test's bestehend aus einem Fragenkatalog und der dazugehörigen Wissensbasis
  • Implementierungserweiterung um Tests im Web Interface zu erstellen
  • Tests als Linked Data zur Verfügung stellen

Semantischer Android Client for Communities

Betreuer: Jörg Unbehauen
Studenten: Kanitz / Weißbecker

Für die international aktive Community Klappstuhlclub soll als Beispiel für eine niederschwellige Integration semantischer Technologien ein mobiler Client erstellt werden.


Der mobile Client soll mit einem SPARQL Endpunkt und einem Wordpress plugin interagieren und dabei folgendende Aktivitäten unterstützen:

  • Anzeige und Führen zum nächsten Treffen
  • Bei Anwesenheit am Treffpunkt: Hinzufügen von Kommentaren, Kontrolle der Anwesenheit, Bilder hochladen

Bestandteile dieses Praktikums sind:

  • Entwurf und Entwicklung der Anwendung
  • Abfrage und Weiterentwicklung eines existierenden Vokabluars
  • Ansprechende Darstellung der Abfrageergebnisse.

Das Ergebnis soll unter einer offenen Lizenz zur Verfügung gestellt werden.


Für dieses Praktikum sind Java Kenntnisse erforderlich.


Onto Wiki Erweiterungen (Mehrere Themen)


Onto Wiki ist ein browserbasierte Werkzeug, welches kooperatives und agiles Wissensmanagement nach Art eines Wikis unterstützt. Die vom Onto Wiki verwalteten Wissensbasen lassen sich sowohl in einer Vielzahl von Sichten erkunden und betrachten, als auch bearbeiten. Onto Wiki ist ein in PHP geschriebenes Open Source Projekt, welches mittlerweile in Version 0.9.5 RC1 verfügbar ist.


Für die folgenden Praktikumsthemen sind Kenntnisse in PHP notwendig.

Development of a Semantic Web Extension for poll execution based on RDF Questionnaire's

Betreuer: Michael Martin, Timofey Ermilov
Studenten: 1 bis 3 Studenten

Zur Durchführung von Umfragen werden Fragenkataloge verwendet. Zur Veröffentlichung von Umfrageergebnissen ist RDF besonders geeignet, da sich Fragenkatalogsinformationen zusammen mit den Umfrageergebnissen publizieren lassen. Zusätzlich ist ein Interlinking mit weiteren bestehenden Datenbasen im Linked Open Data Web möglich, was das Spektrum an potentiellen Sichten auf die Umfrageergebnisse erhöht und weitere Analysen ermöglicht.


Zur Unterstützung der Datenerfassung wird eine Komponente benötigt, die den Erfassungsprozess abbildet und dabei benutzerfreundliche Oberflächen auf Basis eines bestehenden Questionnaire-Vokabulares erzeugt (Angedacht ist hierbei die Unterstützung von Web und mobilen Web Umgebungen).


Vorraussetzung der Vergabe des Themas:

  • MUSS: PHP + JS Kentnisse
  • KANN: SPARQL + RDF 

Das Ergebnis wird unter einer offenen Lizenz zur Verfügung gestellt.
Der Umfang der Umsetzung ist abhängig von der Anzahl der Teilnehmer und wird im ersten Gespräch mit den Studenten vereinbart.

Open Innovation im Gesundheitswesen

Betreuer: Michael Martin, Romy Elze
Studenten: Konrad Abicht, Lars Eidam

An der Universität Leipzig wird ein Informationsmanagementsystem auf Basis von Onto Wiki zur Unterstützung von Kernfragen der ALS-Forschung (Amyotrophe Lateralsklerose) entwickelt. Zur Verbesserung der Benutzbarkeit des medizinischen Personals werden einige Anpassungen des Onto Wiki's benötigt. Auf Basis der bestehenden Domänen-Schemata sind im Rahmen des SWP-Praktikums speziell angepasste Eingabemasken zu entwickeln.


Kenntnisse: (PHP, Java, SPARQL)
Aufgabe: Entwicklung RDF-Schema-basierter Eingabemasken für die Ontowiki-Plattform
Lernziel: Durchführung Entwicklungsprojekt, Anwendung von Ontologien, SPARQL, RDF



 
Zu dieser Seite gibt es keine Dateien. [Zeige Dateien/Upload]
Kein Kommentar. [Zeige Kommentare]