Anwendungsbeispiel
 
Abbildung 1: Bildschirmhardcopy des Data Stream Networks mit einem kleinen Beispielnetz:
 
Stellen wir uns vor uns liegen Messungen eines Observablenvektors A vor, der den Zustand eines dynamischen Systems S zu bestimmten Zeitpunkte beschreibt. Diese Daten stehen uns in Form einer Zeitreihe als Datei auf der Festplatte zur Verfügung. Sie werden durch den Zeitreihenlade-Knoten (1) in das Netz gebracht und liegen dort durch Knoten (2) symbolisiert zur Weiterverarbeitung bereit. Weiterhin haben wird Daten einer andere Observable B des System, die über einen unbekannten inneren Zusammenhang mit dem Zustand des Systems verknüpft ist (24). Wir stellen uns jetzt die Aufgabe aus den in den Datensätzen enthaltenen Korrelationen die Abbildung vom ersten Observablenvektor auf die zweite Observable zu schätzen. Da wir eine allgemeingültige Abbildung suchen und nicht nur die vorliegenden Datensätze approximieren wollen (Stichwort: Overfitting), teilen wir unsere Daten in Trainings- und Testdatensatz auf. Mit Knoten (3) für A und Knoten (23) für B wird diese Aufgabe erledigt. B ist eine multivariante Zeitreihe und nehmen wir an enthält 100 Observablen pro Zeitpunkt, die stark untereinander korreliert sind. Um das Rauschen herauszufiltern und um die Algorithmen nicht mit unnötigen Datenmengen zu belasten werden die Daten vorverarbeitet. Dazu bestimmen wir die Kreuzkorrelationsmatrix (10) mit (9) und wenden eine Hauptkomponentenanalyse (PCA) in (6) an. Das Ergebnis liegt in (7) vor und wird mit (16) in eine Grafik gedruckt und interpretiert. Wir erkennen, daß nur die ersten 5 Komponenten relevante Information enthalten und stellen dieses in der PCA-Transformation (8) ein. Derselbe Parameter wird in (12) für den Testdatensatz (5) verwendet. Die Menge der reduzierten jetzt 5-dimensionalen Datenpunkte (11) wird in (14) einer Phasenraumclusterung unterzogen und liefert in (15) die Vorstufe eines Neuronalen Netzes (RBFS). Das Netz wird in (17) mit den Trainingsdaten (26) gefittet und liefert in (18) das RBFS als Ergebnis. Dieses wird mit (28) auf den Testdatensatz (13) angewendet. Die berechnete Zeitreihe (29) sollte jetzt ähnlich der gemessenen Zeitreihe (27) sein. Um dieses zu prüfen werden sie voneinander abgezogen (20). Die Differenzzeitreihe (22) wird dann auf ihre Kenngrößen, wie z.B. die Steuung untersucht.