Inhaltsverzeichnis

STAT12 Zeitreihenanalyse

STAT12 Zeitreihenanalyse

Modul-Icon	STAT12 Zeitreihenanalyse
Veranstaltung	…
Autor	Walbrun
Bearbeitungsdauer	…
Präsentationstermin	…
Zuletzt geändert	…

<note warning> Achtung: diese Wiki-Seite befindet sich noch im Aufbau und ist noch nicht finalisiert !! </note>

<note tip> Hier findet ihr Hilfestellungen beim Formatieren des Wikis: HowTo - Wiki-Format
Hier gibt es Hilfe zum Erstellen eines Tutorials/Podcasts HowTo - Tutorial </note>

Einleitung

Bei der Datenanalyse wird zwischen Querschnittsdaten und Längsschnittdaten (Zeitreihendaten) unterschieden. In diesem Wiki zur Zeitreihenanalyse werden wir uns hauptsächlich mit den Zeitreihendaten beschäftigen.

Bei der Zeitreihenanalyse geht es nicht um den Vergleich von Zuständen zu unterschiedlichen Zeitpunkten, sondern um die Darstellung von Abläufen und Prozessen zwischen Zuständen. (Von der Lippe, P.M. S.393)

Die Zeitreihenanalyse bildet ein wichtiges Anwendungsgebiet der Regressionsanalyse. (STAT5 Regression)

<note important>Die Zeitreihenanalyse dient der Erklärung und Beschreibung der zeitlichen Entwicklung einer Variablen, besonders bei der Erstellung von Prognosen (Schätzungen) für weitere Zeitpunkte findet sie ihre Anwendung. Sie ist somit wichtig für die Stützung von Entscheidungsproblemen jeglicher Art. (Backhaus S.114)</note>

Ziel einer Zeitreihenanalyse ist es, aufgrund von Beobachtungen in der Vergangenheit, Strukturen und Gesetzmäßigkeiten aufzudecken um Modelle zu entwickeln, die zukünftige Ereignisse vorhersagen (Haar, 2011, S.27).

Praktische Anwendungen sind somit:

das Erstellen von Prognosen,
das Analysieren und somit Erkennen und Verstehen von Ursachen und
die Kontrolle von Prozessen

um Abweichung zwischen Ist-und Sollgröße auszugleichen. (Von der Lippe, P.M. S.393/394)

Die Zeitreihe

Formal gesehen ist eine Zeitreihe eine Messung von Werten einer Variablen Y (z.B. Wetter, Sportlerzahl, Wettkämpfe) die über eine bestimmte Zeit gemessen wird. Die Messwerte sind bestimmten Zeitpunkten zugeordnet. Man erhält so mehrere, diskrete Werte die als y1, y2, y3, … bezeichnet werden. Die Zahl im Index steht für den Zeitpunkt t (z.B. Tage, Monate, Perioden) der Messung. Der Beobachtungszeitraum der Zeitreihe wird durch (1:T) bestimmt (Backhaus S.114).

Vorgehensweise bei der Analyse von Zeitreihen

1. Visualisierung

Es ist wichtig sich vor jeder Untersuchung eine Bild von der zu analysierenden Zeitreihe zu machen. Die Visualisierung einer Zeitreihe ist eine wichtige Grundlage zur Formulierung eines geeigneten Modells (S.119 Backhaus). Der Graph einer Zeitreihe kann bereits erste Informationen über den Entwicklungsverlauf, sowie Brüche und Ausreißer der Zeitreihe liefern (Von der Lippe. S.395). Passende Darstellungsarten sind z.B. Streudiagramme, Balkendiagramme oder Liniendiagramme, bei denen die Messdaten über die Zeit aufgetragen werden. Siehe Abbildung 1-3 : (S.119 Backhaus)

Abbildung 1: Balkendiagramm

Abbildung 2: Liniendiagramm

Abbildung 3: Streudiagramm

2. Formulierung eines Modells

Zeitreihenverläufe können sehr unterschiedliche Formen annehmen. Die Wahl des richtigen Modells ist eine wichtige, jedoch nicht ganz leichte Entscheidung. Ein Grundprinzip bildet die Zeitreihenzerlegung, bei der eine Zeitreihe in unterschiedliche Komponenten zerlegt wird.

Man unterscheidet zwischen Additiver Zeitreihenzerlegung (Y=A+K+S+u) und Multiplikativen Zeitreihenzerlegung (Y=A*K*S*u). Die Komponenten beider Zerlegungen sind jeweils die Gleichen, sie unterscheiden sich nur hinsichtlich ihrer mathematischen Rechenzeichen.

Die Prognosevariable Y wird durch die Trendkomponente (A), die Konjunkturkomponente (K) und die Saisonkomponente (S) beeinflusst. Die Trendkomponente A kann ein Wachstum (positiv) oder eine Schrumpfung (negativ) darstellen, sie kann linear oder nichtlinear sein (Backhaus S.120). Die Trendkomponente A ist Ausdruck von nicht periodischen, „langfristigen“ Einflussfaktoren auf Y (Von der Lippe. S.397). K und S sind zyklische Schwankungen und verlaufen daher nichtlinear.

A, K und S werden zusammen als systematische Komponenten bezeichnet. Die Störgröße (u) ist eine zufällige Komponente.

Beispiel: Bei der oben dargestellten Zeitreihe (Absatzmenge über der Zeit) sind nur kleine Schwankung zu erkennen. Somit fallen die Komponenten K und S weg, da diese für die zyklischen Schwankungen stehen. Unser Modell lautet somit: $Y = A + u$. Da dieses Modell noch zu ungenau ist, soll der Trendparameter A spezifiziert werden. Der Einfachheit halber gehen wir von einem linearen Verlauf aus, auch wenn eine kleine Nichtlinearität bei der Visualisierung (Schritt 1) zu erkennen ist.

Lineares Trendmodell: Y = α + β*t + u

α und β: Unbekannte Parameter, deren Größe man auf Basis von den bereits bekannten Werten schätzen muss.

Trendparameter β: Zuwachs von Y pro Periode (Backhaus S.120)

3. Schätzung eines Modells

Zur Schätzung der Parameter α und β wird eine Regressionsanalyse (STAT5 Regression) verwendet ( UV = Zeit / AV = Menge).

Nach dem Durchführen der Regressionsanalyse erhalten wir folgende Regressionsgleichung:

Ŷ = a + b * t = 1619,5 + 120,9 * t (R² = 0,972)

b gibt die Steigung an und somit lässt sich aus der Regressionsgleichung ablesen, dass die Absatzmenge pro Periode um 121 Kartons zunimmt. (Backhaus, S.121)

4. Erstellung von Prognosen

Zum Erstellen von Prognosen hilft uns die geschätzte Regressionsgleichung. Durch eine kleine Änderung in der Formel lässt sich ein Prognosewert für eine in der Zukunft liegende Prognose bestimmen.

Man unterscheidet zwischen Punktprognosen und Intervallprognosen.

Punktprognose: ŷ T+k= a + b*(T+k) (T+k) = die in der Zukunft liegende Periode

Prognoseintervall ( Konfidenzintervall):

yT+k= ŷT+k± tα/2*sp(T+k)

  Als Intervall geschrieben:
ŷT+k- tα/2*sp(T+k) ≤  yT+k  ≥  ŷT+k+ tα/2*sp(T+k)

tα/2 = Quantil der t-Verteilung ( Vertrauenswahrscheinlichkeit: 1-α; Freiheitsgrade: T-2; Zweiseitiger t-Test)

Wenn man Prognosen erstellt, hat man es auch leider immer mit einem Prognosefehler zu tun. Dieser kann durch folgende Formel herausgerechnet werden:

sp(T+k)=√(1/(T-2) ∑_(t=1)^T▒〖et^2 〗)*√(1+1/T+¹⁾

s = Standardfehler der Regression

t ̅= Mittelwert der Zeitvariablen t

st= Standardabweichung der Zeitvariablen t

Anhand des Prognosefehlers, zu unterschiedlichen Perioden, kann eine Entwicklung dieses Fehlers aufgezeigt werden. Aus der Formel zur Berechnung des Prognosefehlers wird ersichtlich, dass dieser mit dem Prognosehorizont (T+k) anwächst. Der geringste Prognosefehler liegt im Mittelpunkt der Zeitreihe vor. (Backhaus S.123)

5. Prüfung der Prognosegüte

Eine Prognose basiert auf Schätzungen und kann somit nicht fehlerfrei sein. Da die richtigen Werte zum Zeitpunkt der Prognose nicht bekannt sind, ist eine sofortige Prüfung der erstellten Prognose nicht möglich.

Eine Prognose kann durch Ex-Post-Prognosen überprüft werden. Dafür wird der Stützbereich für die Schätzung des Modells verkürzt. Auf Basis dieses neuen Stützbereiches wird eine neue Regressionsanalyse durchgeführt und die geschätzten Werte mit den beobachteten Werten verglichen. Zur Beurteilung der empirischen Prognosegüte können die Fehlermaße MAD, MAPE und U bestimmt werden.

Autokorrelation

Die Autokorrelation bildet eine weitere Kenngröße zur Beschreibung einer Zeitreihe. Durch diese Methode erhält man erste Informationen zur seriellen Abhängigkeit der Zeitreihe. Sie überprüft ob eine Abhängigkeit zwischen einer Wiederholungsmessung und der vorausgegangenen Messung besteht (Wilhelm, 1999, S.486).

Nichtlineares Trendmodell

Nur selten haben reale Trendverläufe eine lineare Struktur. Bei kurzen Prognosen reicht es eine Näherung über ein lineares Trendmodell zu erstellen. Bei langfristigen Prognosen ist ein nichtlineares Trendmodell das geeignete Mittel (Backhaus, S. 126).

Bei den nichtlinearen Trendmodellen wird unterschieden zwischen:

- Das Quadratwurzel-Modell

- Das Logarithmische Modell

- Das Multiplikative Modell

- Das Potenz-Modell

Fragen

…
…

alternativ mit Show-Button:

<spoiler | 1. Frage 1 ?> Antwort zu Frage 1 </spoiler>

Literatur

Backhaus, Multivariate Varianzanalyse

Dissertation Benjamin Haar, 2011

Von der Lippe, P.M. Zugriff am 30.12.2015 unter http://www.von-der-lippe.org/dokumente/buch/BUCH11.pdf

Wilhelm, A. (1999). Zeitreihenanalyse. In Strauß, B., Haag, H. & Kolb, M. (Hrsg.), Datenanalyse in der Sportwissenschaft ( S.481-502). Schorndorf: Hofmann.

indexmenu_n_12

¹⁾

T+k-t ̅)²)/(∑_t▒〖(t-t ̅)²〗