[TASK] Generic commit
This commit is contained in:
parent
094af11968
commit
ed0459b084
|
@ -154,17 +154,15 @@ Hannover, den \today \hfill Unterschrift
|
|||
|
||||
\chapter{Motivation}\label{cpt:motivation}
|
||||
|
||||
Mit der fortschreitenden Digitalisierung von Alltagsgegenständen und ihrer Verbindung mit dem Internet sind immer mehr offene Systeme online verfügbar, die ihre Sensordaten und Zustandsinformationen als RDF\footnote{Ressource Description Framework - Mehr dazu in Kapitel \ref{cpt:basics}}-Datenstrom anbieten. Diese Ereignisdatenströme liefern kontinuierlich Daten über hochfrequent auftretende Ereignisse, sodass sich innerhalb kürzester Zeit sehr große Datenmengen ansammeln. Diese Ereignisse bilden jeweils kleine Stücke der Realität über die in ihnen enthalten Messdaten und Zustandsinformationen ab, sofern sie nicht bedingt durch technischen Defekt oder Messfehler ungültige Daten enthalten und somit zur weiteren Verarbeitung ungeeignet sind. Weiterhin muss betont werden, dass die Gültigkeit der Ereignisdaten sehr begrenzt ist und spätestens durch das nächste Ereignis hinfällig wird.
|
||||
Mit der fortschreitenden Digitalisierung von Alltagsgegenständen und ihrer Verbindung mit dem Internet sind immer mehr offene Systeme online verfügbar, die ihre Sensordaten und Zustandsinformationen als RDF\footnote{Ressource Description Framework - Mehr dazu in Kapitel \ref{cpt:basics}}-Datenstrom anbieten. Diese Ereignisdatenströme liefern kontinuierlich Daten über hochfrequent auftretende Ereignisse, sodass innerhalb kürzester Zeit sehr große Datenmengen entstehen. Diese Ereignisse bilden jeweils kleine Stücke der Realität über die in ihnen enthalten Messdaten und Zustandsinformationen ab, sofern sie nicht bedingt durch technischen Defekt oder Messfehler ungültige Daten enthalten und somit zur weiteren Verarbeitung ungeeignet sind. Weiterhin muss betont werden, dass die Gültigkeit von Ereignisdaten sehr begrenzt ist und oft schon durch ein neues Ereignis hinfällig wird.
|
||||
|
||||
Da einzelne Ereignisse für sich betrachtet nur eine begrenzte Aussagekraft haben, ist es zum höheren Verständnis der dahinter verborgenen Situation notwendig, sie mit den zuvor aufgetretenen Ereignissen in einen Kontext zu setzen, um in ihnen Muster zu erkennen und daraus höherwertige Informationen in Form von komplexen Ereignissen zu gewinnen.
|
||||
Da die einzelnen Ereignisse für sich betrachtet nur eine begrenzte Aussagekraft und Gültigkeit haben, ist es zum höheren Verständnis der dahinter verborgenen Situation notwendig, sie mit den zuvor aufgetretenen Ereignissen in einen Kontext zu setzen, um zwischen ihnen Muster zu erkennen und aus ihnen höherwertige Informationen in Form von komplexen Ereignissen zu gewinnen.
|
||||
|
||||
Die Integration von Domänenwissen\footnote{Hintergrundwissen} ist der abschließende Schritt, um die Brücke zwischen den aus komplexen Ereignissen gewonnenen Kenntnissen und bereits bekannten Fakten zu schlagen, die diese gewonnenen Erkenntnisse in einen eindeutigen Zusammenhang stellen.
|
||||
Die Integration von Domänenwissen\footnote{Hintergrundwissen für den Kontext der Ereignisverarbeitung} ist ein weiterer Schritt, der die Brücke zwischen den aus komplexen Ereignissen gewonnenen Kenntnissen und bereits bekannten Fakten zu schlagen, die diese gewonnenen Kenntnisse in einen eindeutigen Zusammenhang stellen und eine eindeutige Interpretation ermöglichen.
|
||||
|
||||
Um unter den genannten Bedingungen viele Ereignisdatenströme mit hochfrequenten Ereignissen in nahezu Echtzeit zu verarbeiten ist CEP\footnote{Complex-Event-Processing} das Mittel der Wahl. Hierbei werden die Ereignisse der verschiedenen Datenströme für begrenzte Zeiträume im lokalen Speicher vorgehalten, innerhalb von Sliding-Windows betrachtet und zu komplexeren Ereignissen aggregiert.
|
||||
Um unter den genannten Bedingungen viele Ereignisdatenströme mit hochfrequenten Ereignissen in nahezu Echtzeit zu verarbeiten ist CEP\footnote{Complex-Event-Processing} das Mittel der Wahl: Mit CEP werden die Ereignisse der verschiedenen Datenströme für begrenzte Zeiträume im lokalen Speicher vorgehalten und innerhalb von Sliding-Windows betrachtet. Dabei können Ereignismuster erkannt werden und verschiedene Ereignisse zu komplexeren Ereignissen aggregiert werden.
|
||||
|
||||
Ziel dieser Arbeit ist die praktische Nutzung der CEP-Engine \enquote{C-SPARQL} zur Verarbeitung von RDF-Ereignisdatenströmen am Beispiel einer Autoverleihgesellschaft, die ihre Fahrzeuge überwachen möchte um starken Verschleiß und sich anbahnende Defekte an ihnen erkennen möchte.
|
||||
|
||||
Des weiteren soll ergründet werden, welche technischen Möglichkeiten existieren, um Reasoning auf RDF-Datenströmen zu betreiben - eine Technik, die Erkenntnisse aus den Ereignisströmen durch Anstellung von Schlussfolgerungen auf den Daten der Datenströme extrahiert.
|
||||
Ziel dieser Arbeit ist nach der Einführung in die Konzepte von CEP und RDF die praktische Nutzung der CEP-Engine \enquote{C-SPARQL} zur Verarbeitung von RDF-Datenströmen am Beispiel einer Autoverleihgesellschaft zur Überwachung von Leihfahrzeugen. Auch soll ergründet werden, welche technischen Möglichkeiten existieren, um Reasoning auf RDF-Datenströmen zu betreiben - eine Technik, die Erkenntnisse aus den Ereignisströmen durch Anstellung von Schlussfolgerungen auf den Daten der Datenströme extrahiert.
|
||||
Diesbezüglich soll ergründet werden, welche CEP-Engines Reasoning bereits implementieren und wie weit ihre technischen Möglichkeiten in diesem Bereich reichen.
|
||||
|
||||
|
||||
|
@ -213,19 +211,20 @@ Um die Ereignisdaten aus den beiden beschriebenen Datenströmen bei der Verarbei
|
|||
|
||||
\subsection{RDF im semantischen Web}\label{cpt:rdf-semantic-web}
|
||||
|
||||
Das Ressource Description Framework (RDF) wird bereits im semantischen Web zur Erfassung und Verknüpfung von Wissen verwendet. RDF-Daten bestehen aus einer Menge von Tripeln, welche sich aus den drei Komponenten Subjekt, Prädikat und Objekt in genau dieser Abfolge zusammensetzen. Jeder dieser drei Bestandteile eines Tripels wird durch eine eindeutige URI (Uniform Resource Identifier) identifiziert.
|
||||
\begin{lstlisting}[caption={Ein einzelnes Beispieltripel},label={lst:sample_rdf_triple}]
|
||||
Das Ressource Description Framework (RDF) wird im semantischen Web zur Modellierung und Beschreibung von Wissen verwendet. RDF-Daten bestehen aus einer Menge von Tripeln, welche sich aus den drei Komponenten Subjekt, Prädikat und Objekt in genau dieser Abfolge zusammensetzen. Jeder dieser drei Bestandteile eines Tripels wird durch einen eindeutigen Uniform Resource Identifier (URI\footnote{Der URI wird in RFC 3986 beschrieben. Anstelle eines URI kann auch ein IRI (Internationalized Resource Identifier) verwendet werden --- die internationalisierte Form des URI nach RFC 3987.}) identifiziert.
|
||||
\begin{lstlisting}[caption={Ein einzelnes RDF-Tripel},label={lst:sample_rdf_triple}]
|
||||
<http://example.org/carSim/objects/Car#23> <http://example.org/carSim/carSimulationOntology#isCarModel> <http://example.org/carSim/objects/CarModel#42> .
|
||||
\end{lstlisting}
|
||||
Das in Listing~\ref{lst:sample_rdf_triple} enthaltene Tripel ordnet das Auto-Subjekt \#23 über das Prädikat \texttt{isCarModel} dem Objekt Automodell \#42 zu.
|
||||
|
||||
Das in Listing~\ref{lst:sample_rdf_triple} enthaltene Tripel ordnet das Auto-Subjekt \texttt{\#23} über das Prädikat \texttt{isCarModel} dem Objekt Automodell \texttt{\#42} zu.
|
||||
Wie anhand des Beispiels erkennbar ist, ist die explizite Notation für Tripel aufgrund der häufigen Nennung von vollständigen URIs wenig platzsparend und für große Datenmengen somit nicht empfehlenswert. Hierfür bietet sich die Nutzung von Prefixen an, die nach einmaliger Definition innerhalb eines Kontextes (zum Beispiel einer Datei) verwendet werden können.
|
||||
Listing~\ref{lst:sample_rdf_triple_with_prefix} zeigt die Notation von Tripeln im Turtle\footnote{Siehe auch \cite{w3c:turtle}}-Format unter Verwendung von Prefixen.
|
||||
Listing~\ref{lst:sample_rdf_triple_with_prefix} zeigt die Notation von Tripeln im Turtle\footnote{Siehe auch die Spezifikation der Turtle-Notation nach \cite{w3c:turtle}}-Format unter Verwendung von Prefixen.
|
||||
\begin{lstlisting}[caption={Das Beispieltripel aus Listing~\ref{lst:sample_rdf_triple} mit Prefixen},label={lst:sample_rdf_triple_with_prefix}]
|
||||
@prefix car: <http://example.org/carSim/objects/Car#> .
|
||||
@prefix carModel: <http://example.org/carSim/objects/CarModel#> .
|
||||
@prefix carSim: <http://example.org/carSim/carSimulationOntology#> .
|
||||
@prefix carOnt: <http://example.org/carSim/carSimulationOntology#> .
|
||||
|
||||
car:23 car:isCarModel carModel:42 .
|
||||
car:23 carOnt:isCarModel carModel:42 .
|
||||
\end{lstlisting}
|
||||
Über Prädikate können diesem Subjekt mit Spezifikation im Objekt-Teil des Tripels bestimmte Attribute mit Werten zugesprochen werden oder Verknüpfungen mit anderen Subjekten hergestellt werden.
|
||||
|
||||
|
|
Loading…
Reference in New Issue