Sommersemester 2012

Seminar: Linked Open Data for E-Business

Thomas Riechert, Sebastian Hellmann Axel Ngonga

Sommersemester 2012
Termin: freitags; 11:15 – 12:45
Ort: Seminargebäude 1–10
Modul: Betriebliche Informationssysteme 10–202–2308

Inhalt

Ein Schwerpunkt stellt die Integration von Informationssystemen in Unternehmen dar. Eine interessante Fragestellung ist die Entwicklung von Methoden und deren Implementierung für die unternehmensinterne Suche in vorhandenen strukturierten Unternehmensdaten und deren semantische Verknüpfung. Ein möglicher Ansatz besteht darin bestehende Datenquellen im Intranet zu publizieren und zu vernetzen, sowie ihre Semantik zu formalisieren. Im Rahmen einer solchen zu entwickelnden Methodik sind die drei Konzepte Publikation, Synchronisation und Suche zu untersuchen. Im Rahmen des Seminars werden Fragestellungen in diesen Bereichen untersucht.

Umfang der Veranstaltung

Bei erfolgreicher Teilnahme an diesem Problemseminar erhält jeder Teilnehmer einen benoteten Seminarschein. Hierfür sind folgende Anforderungen zu erfüllen:

Regelmäßige Teilnahme am Seminar
Kurzpräsentation zum gewählten Thema am 04.05. (5 min)
Präsentation des Themas (20 min + 10 min Diskussion)
Veröffentlichung einer Literaturliste eine Woche vor dem Vortrag
Schriftliche Ausarbeitung (8–12 A4 Seiten)
- Bei der Ausarbeitung ist die Vorlage der Lecture Notes in Informatics zu verwenden. Die Ausarbeitung ist als PDF-Dokument und als Quelle (Latex,Word) per E-Mail abzugeben.

Termine

21.04.2012 Auftakt
27.04.2012 Vergabe der Themen / Einführung in das wissenschaftliche Arbeiten
04.05.2012 Kurzpräsentation zum gewählten Thema
29.06.2012 Präsentation der Ergebnisse
06.07.2012 Präsentation der Ergebnisse

Themen

Vokabular Alignment Muster

Bearbeiter:
Betreuer: Thomas Riechert
Links:

Ontology Design Pattern, PDF Document

An Approach for Ontology Modularization

Durch Vokabular-Alignment wird vermieden, dass Konzeptstrukturen in Teilbereichen, die bereits an anderer Stelle semantisch eindeutig beschrieben sind, in einem weiteren Vokabular abgebildet werden. Das Vokabular-Alignment ist nicht mit dem Ontologie-Alignment gleichzusetzen. Der Fokus der Forschungsarbeiten zum Ontologie-Alignment liegt vor allem beim Finden äquivalenter Ressourcen in verschiedenen Ontologien. Auf technischer Ebene, zur Modellierung von Ontologien, existieren Werkzeuge zur Modularisierung von Ontologien z. B. als Erweiterung für das Ontologie-Modellierungswerkzeug Protégé. Für das Alignment von Ontologien werden in der Praxis typische Muster genutzt. Solche Muster werden im Wiki-System Ontology Design Pattern publiziert und diskutiert.

Impact von DBpedia auf die Forschung

Bearbeiter: Marcus Nitzschke
Betreuer: Sebastian Hellmann
Links:

Analog zu den Studien über den Einfluss von Wikipedia auf die Forschung soll das gleiche für DBpedia untersucht werden. Einstiegspunkt sind die oben genannten Links sowohl eine “site:" beschränkte Google Suche duf den Publikationen der großen Semantic Web Konferenzen der letzen Jahre: "site:http://iswc2011.semanticweb.org/fileadmin/iswc/Papers/Research_Paper dbpedia” http://www.google.com/search?q=site%3Ahttp%3A%2F%2Fiswc2011.semanticweb.org%2Ffileadmin%2Fiswc%2FPapers%2FResearch_Paper+dbpedia .
Große Konferenzen sind WWW, ISWC, ESWC, EKAW, KCAP, Journals sind SWJ, JWS, IJSWS

Die Arbeit soll dann irgendwo publiziert werden, damit sie in das oben genannte Projekt “Academic Studies on Wikipedia” und auf http://en.wikipedia.org/wiki/DBpedia zurückfliessen kann.

Recherche und Vergleich von Linked Data Visualisierungslösungen für die Linguistische Linked Data Cloud

Bearbeiter: Alexander Lust
Betreuer: Sebastian Hellmann
Links:

Forschungsfragen:

Nach welchen Kriterien lassen sich die verschiedenen Tools einordnen und klassifizieren? Welche Kriterien gibt es bereits in der Literatur?
Sind die Visualisierungslösungen adequat für die Domäne der Linguistik oder sind sie nur für andere generelle Daten gut (also Städte, Personen, Statistiken)?

Survey Knowledge Extraction Tools for Textual and Semi-Structured Sources

Bearbeiter Textual Sources: Frank Stumpf
Bearbeiter Semi-Structured Sources: offen
Betreuer: Sebastian Hellmann
Links:

Der von mir initial mit-verfasste Wikipedia Artikel http://en.wikipedia.org/wiki/Knowledge_extraction gibt hauptsächlich einen Überblick über Wissensextraktion aus Datenbanken und XML. Im Rahmen der Seminararbeit soll der Eintrag erweitert werden durch:

Extraktion aus Text, Ontology learning
Extraction aus Wikis (DBpedia)

Aufgaben:

Recherche der Tools
Erweiterung der Klassifikationskriterien
Vergleich der Tools
Schreiben der Recherche in einem Bericht (von einfacher Textqualität, notizenartig)
Erweitern des Wikipedia Artikels (Achtung nur wenig Inhalt ist geeignet für Wikipedia, die Qualität muss relativ hoch sein und ausserdem gut referenziert. )

Studie: Welche Lizenzen werden an der Uni Leipzig verwendet?

Bearbeiter: offen
Betreuer: Sebastian Hellmann
Links:

Die Arbeit soll den Stand der aktuellen Lizenzlage an der Uni Leipzig erfassen und Klarheit auf diesem Gebiet zu schaffen. Die Arbeit soll gut recherchiert sein und eher verlässliche und gut referenzierte Informationen enthalten, als einen möglichst großen Umfang haben.
Fragen:

Welche Richtlinien empfiehlt die Uni Leipzig? Welche Rechte behält sie ein?
Welche Lizenzen werden an den einzelnen Fakultäten und Instituten tatsächlich verwendet? hierzu kann man einen Fragebogen machen oder auf die entsprechenden Web – seiten schauen.
Wie werden die Arbeiten von Studenten behandelt?

Evtl. kann man mit den Sturas zusammenarbeiten, das muss aber alles selbst organisiert werden.

Vergleich existierender Wiktionary Extraktionsansätze

Bearbeiter: offen
Betreuer: Jonas Brekle, Sebastian Hellmann
Links:

wiktionary: http://wiktionary.org/
DBpedia Wiktionary: http://wiktionary.dbpedia.org/
wikokit: http://code.google.com/p/wikokit/wiki/d2rqMappingSPARQL
texai: http://sourceforge.net/projects/texai/files/wiktionary-rdf/fuer-Universitaeten-bis-2012.html

Literatur, Statistik über Wiktionary:

http://www.ukp.tu-darmstadt.de/fileadmin/user_upload/Group_UKP/publikationen/2012/igi-saod2011-meyer-ontowiktionary.pdf

Es existieren verschiedene Implementierungen zur Extraktion von Wörterbuch-Daten im RDF-Format aus Wiktionary:

Ein bei uns am Lehrstuhl entwickelter Ansatz mitilfe des DBpedia Frameworks
wikokit
texai
Evtl. weitere

Diese Ansätze sollen qualitativ und quantitativ miteinander verglichen werden. Es ist also zunächst eine
Auseinandersetzung mit dem Schema der extrahierten Daten notwendig. Es soll dokumentiert werden mit welchem Detailgrad extrahiert wird und welche Einschränkungen existieren. Danach soll eine Statistik erstellt
werden, die zu definierende Kennzahlen vergleicht. Als Beispiel käme dafür in Frage: Anzahl der Definitionen, Synonyme, Übersetzungen – je Wort und absolut. Die zur Analyse sinnvollen Kennzahlen werden wir
gemeinsam nach der Betrachtung der Schemata bestimmen. Die Daten sollen zudem mit Gnuplot visualisiert werden.

Alignment von Enterprise Vokabularen

Bearbeiter: Patrick Westphal
Betreuer: Thomas Riechert
Links:

Innerhalb von Unternehmen werden verschiedene strukturierte Informationsquellen wie Customer Relationship Management (CRM) Systeme, Projektmanagement Werkzeuge oder Repositories über IT-Infrastrukturen und Serviceinformationen verwendet. Die im Rahmen des Seminars beschriebene Integration dieser Informationen erfolgt auf Basis von RDF-Ontologien, die aus diesen Informationssystemen generiert werden. In der Praxis haben sich bereits OWL-Voakabulare etabliert. Diese sollen im Rahen dieser Arbeit gefunden, beschreiben und angeglichen werden.

Semantic Web basiertes Software-Engineering

Bearbeiter: David Baum
Betreuer: Thomas Riechert
Links:

Workshop on Semantic Web Enabled Software Engineering

Das wachsende Interesse an der Nutzung von Semantic Web Technologien im Software-Engineering spiegelt sich in Publikationen auf dem seit 2005 stattfindenden Workshop on Semantic Web Enabled Software Engineering (SWESE) wider. Im Rahem dieser Arbeit sollen Paper dieses Workshops seit dem Jahr 2005 analysiert und die adressierten Problemfelder analysiert werden.

Ontologien in der Geschichtswissenschaft

Bearbeiter: Thomas Schöne
Betreuer: Thomas Riechert
Links:

http://catalogus-professorum.org

Außerhalb der Unternehmensgrenzen existieren z.B. interessante Forschungscommunities. Eine solche Community bilden Historiker, die sich mit Prosopographischer Forschung befassen. In diesem Forschungsfeld werden individuelle Forschungsergebnisse z.B. zu Personen, Institutionen oder Ländern in einem neuen Kontext zusammengefasst und analysiert. Im Rahmen dieser Arbeit sollen hier relevante Ontologien gefunden, analysiert und angeglichen werden.

Virtuelle Gemeinschaften im Unternehmen / im Web

Bearbeiter (3x): Natanael Arndt (2), ..., ...
Betreuer: Thomas Riechert
Links:

Communities bilden sich meist domänenabhängig über existierende Datenmodelle. Um solche Communities zu realisieren existieren verschiedene Applikationen wie z.B. Semantische Wikis, aber auch Newsletter oder Mailinglisten. Im Rahmen dieser Arbeit soll diese Umfeld in verschiedenen Feldern neben dem Einsatz in Unternehmen (1) auch bei Forschungscommunities (2) oder in der Open-Source-Software Entwicklung (3) untersucht werden.

Zu dieser Seite gibt es keine Dateien. [Zeige Dateien/Upload]

Kein Kommentar. [Zeige Kommentare]

Information

Letzte Änderung: 2012-06-18 09:50:44 von Thomas Riechert