diff --git a/Bachelorarbeit.tex b/Bachelorarbeit.tex index e649520..d7ba8b4 100644 --- a/Bachelorarbeit.tex +++ b/Bachelorarbeit.tex @@ -152,7 +152,7 @@ Hannover, den \today \hfill Unterschrift %%% Hier geht es richtig los mit dem Text! %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% -\chapter{Einleitung} +\chapter{Einleitung}\label{cpt:introduction} Diese Arbeit beschäftigt sich mit \enquote{Complex Event Processing} (CEP), also der Verarbeitung komplexer Ereignisse auf Ereignisdatenströmen in Kombination mit Do\-män\-en\-wis\-sen, und der praktischen Umsetzung dieses Vorhabens auf Basis von RDF-Datenströmen mit der CEP-Engine \enquote{C-SPARQL}. @@ -162,13 +162,13 @@ Nach einem kurzen Einstieg in das Thema CEP soll der Leser einen Einblick in die An einem Beispielszenario soll dann der Praxiseinsatz von C-SPARQL erklärt werden, in dem einige der vorgestellten Funktionen Anwendung finden. Im Abschluss wird ein kurzer Ausblick auf die technischen Möglichkeiten des \enquote{Reasoning} gegeben --- eine Technik, die es erlaubt auf den vorhandenen und eingehenden Daten logische Operationen und Schlussfolgerungen durchzuführen um daraus neues Wissen abzuleiten. -\section{Motivation} +\section{Motivation}\label{cpt:motivation} -Mit der fortschreitenden Digitalisierung von Alltagsgegenständen und ihrer Verbindung mit dem Internet sind immer mehr offene Systeme online verfügbar, die ihre Sensordaten und Zustandsinformationen als RDF\footnote{Ressource Description Framework - Mehr dazu in Kapitel \ref{cpt:basics}}-Datenstrom anbieten. Ziel dieser Arbeit ist die Verarbeitung dieser Ereignisdatenströme mit der CEP-Engine C-SPARQL im Kontext einer Autoverleihgesellschaft zur Überwachung ihrer Fahrzeuge. Dabei sollen komplexe Ereignisse aus Ereignismustern in den Datenströmen extrahiert werden und unter Integration von lokalem Domänenwissen zur weiteren Interpretation in einen eindeutigen Kontext gesetzt werden. +Mit der fortschreitenden Digitalisierung von Alltagsgegenständen und ihrer Verbindung mit dem Internet sind immer mehr offene Systeme online verfügbar, die ihre Sensordaten und Zustandsinformationen als RDF\footnote{Ressource Description Framework - Mehr dazu in Kapitel \ref{cpt:basics}}-Datenstrom anbieten. Ziel dieser Arbeit ist die Verarbeitung dieser Ereignisdatenströme mit der CEP-Engine C-SPARQL im Kontext einer Autoverleihgesellschaft zur Überwachung von Fahrzeugen. Dabei sollen komplexe Ereignisse aus Ereignismustern in den Datenströmen extrahiert werden und unter Integration von lokalem Domänenwissen zur weiteren Interpretation in einen eindeutigen Kontext gesetzt werden. Ein weiteres Ziel ist die Extraktion von Erkenntnissen aus den Ereignisströmen durch das Anstellen von Schlussfolgerungen auf den erhaltenen Daten (Reasoning). Diesbezüglich soll ergründet werden, welche CEP-Engines Reasoning implementieren und wie weitreichend ihre technischen Möglichkeiten in diesem Bereich reichen. -\section{Szenario} +\section{Szenario}\label{cpt:scenario} Beispielszenario im Kontext dieser Arbeit ist eine Autoverleihgesellschaft, die ihren Fuhrpark überwachen möchte um ihren Kunden vergünstigte Tarife für verschleißarmes Fahrverhalten anbieten zu können. Weiterhin soll auf plötzlich auftretende Probleme an den Leihwagen möglichst schnell reagiert werden können um Schäden zu begrenzen, gefährliche Situationen zu vermeiden und dem Kunden sofort eine Lösung anbieten zu können. Um all dies zu erreichen, werden zwei RDF-Datenströme eingerichtet zur späteren Verarbeitung mit der CEP-Engine C-SPARQL eingerichtet. @@ -219,7 +219,7 @@ Um diese Ereignisdaten bei der Verarbeitung in einen eindeutigen Kontext setzen \end{itemize} -\subsection{RDF im semantischen Web} +\subsection{RDF im semantischen Web}\label{cpt:rdf-semantic-web} Das Ressource Description Framework (RDF) wird bereits im semantischen Web zur Erfassung und Verknüpfung von Wissen verwendet. RDF-Daten bestehen aus einer Menge von Tripeln, welche sich aus den drei Komponenten Subjekt, Prädikat und Objekt zusammensetzen. Ein Subjekt wird durch eine eindeutige URI identifiziert; über Prädikate können diesem Subjekt mit Spezifikation im Objekt-Teil des Tripels bestimmte Attribute mit Werten zugesprochen werden oder Verknüpfungen mit anderen Subjekten hergestellt werden. Aufgrund der Flexibilität dieser Struktur ist es möglich, nahezu jede Art von Informationen auf Tripel abzubilden, wie Listing~\ref{lst:sample_rdf_data} an einem Beispiel zeigt. @@ -242,7 +242,7 @@ Zusätzlich werden im semantischen Web in OWL (Web Ontology Language) formuliert Weiterhin ist es möglich, beliebig viele verschiedene Ontologien gleichzeitig zu verwenden. Diese Flexibilität ermöglicht beispielsweise, dass eine bereits in RDF abgebildete Person durch beliebige Informationen mit weiteren Ontologien ergänzt werden kann, oder dass die Informationen einer abgebildeten Person in verschiedenen, für andere Parteien geläufigen Strukturen verfügbar gemacht werden können. Auch kann innerhalb einer Ontologie auf Objektklassen und Attribute zurückgegriffen werden, die in anderen Ontologien definiert werden. Dies ermöglicht neben Erweiterungen für spezifische Zwecke auch das Übersetzen von Wissen zwischen verschiedenen Ontologien. -\subsection{Abfrage von RDF-Daten via SPARQL} +\subsection{Abfrage von RDF-Daten via SPARQL}\label{cpt:rdf-sparql} \begin{itemize} \item SPARQL als Abfragesprache @@ -282,11 +282,11 @@ CONSTRUCT { \end{lstlisting} -\subsection{Schlussfolgerungen auf RDF-Daten} +\subsection{Schlussfolgerungen auf RDF-Daten}\label{cpt:reasoning} \begin{itemize} \item Was ist Reasoning? -\item Welche Ebenen gibt es? ((OWL, RDFS?) \todo{Ist der Unterschied zwischen den Beiden fürs erste sehr wichtig oder führt das zu weit?}) +\item Welche Ebenen gibt es? ((OWL, RDFS?) - Unterschied erst bei Verwendung wichtig) \item Warum ist es von Vorteil? \item Mögliche Schwierigkeiten dabei? \item Ontologien beschreiben Zusammenhänge zwischen Objektklassen und Klassen, die auf bestimmte Sachverhalte zutreffen.