Warning: Undefined array key "DW68700bfd16c2027de7de74a5a8202a6f" in /is/htdocs/wp1019470_OPI92FFHXV/www/wikiLehre/lib/plugins/translation/action.php on line 237

Warning: Trying to access array offset on value of type null in /is/htdocs/wp1019470_OPI92FFHXV/www/wikiLehre/lib/plugins/translation/action.php on line 237

Warning: Cannot modify header information - headers already sent by (output started at /is/htdocs/wp1019470_OPI92FFHXV/www/wikiLehre/lib/plugins/translation/action.php:237) in /is/htdocs/wp1019470_OPI92FFHXV/www/wikiLehre/inc/Action/Export.php on line 104

Warning: Cannot modify header information - headers already sent by (output started at /is/htdocs/wp1019470_OPI92FFHXV/www/wikiLehre/lib/plugins/translation/action.php:237) in /is/htdocs/wp1019470_OPI92FFHXV/www/wikiLehre/inc/Action/Export.php on line 104

Warning: Cannot modify header information - headers already sent by (output started at /is/htdocs/wp1019470_OPI92FFHXV/www/wikiLehre/lib/plugins/translation/action.php:237) in /is/htdocs/wp1019470_OPI92FFHXV/www/wikiLehre/inc/Action/Export.php on line 104
====== STAT12 Zeitreihenanalyse ====== ^ Modul-Icon | STAT12 Zeitreihenanalyse | ^ Veranstaltung | ... | ^ Autor | Walbrun | ^ Bearbeitungsdauer | ... | ^ Präsentationstermin | ... | ^ Zuletzt geändert | ... | Achtung: diese Wiki-Seite befindet sich noch im Aufbau und ist noch nicht finalisiert !! Hier findet ihr **Hilfestellungen beim Formatieren** des Wikis: [[:benutzung|HowTo - Wiki-Format]] \\ Hier gibt es **Hilfe zum Erstellen eines Tutorials/Podcasts** [[:howto|HowTo - Tutorial]]
===== Einleitung ===== Bei der Datenanalyse wird zwischen Querschnittsdaten und Längsschnittdaten (Zeitreihendaten) unterschieden. In diesem Wiki zur Zeitreihenanalyse werden wir uns hauptsächlich mit den Zeitreihendaten beschäftigen. Bei der Zeitreihenanalyse geht es nicht um den Vergleich von Zuständen zu unterschiedlichen Zeitpunkten, sondern um die Darstellung von Abläufen und Prozessen zwischen Zuständen. (Von der Lippe, P.M. S.393) Die Zeitreihenanalyse bildet ein wichtiges Anwendungsgebiet der Regressionsanalyse. ([[fm:stat:stat05|]]) Die Zeitreihenanalyse dient der Erklärung und Beschreibung der zeitlichen Entwicklung einer Variablen, besonders bei der Erstellung von Prognosen (Schätzungen) für weitere Zeitpunkte findet sie ihre Anwendung. Sie ist somit wichtig für die Stützung von Entscheidungsproblemen jeglicher Art. (Backhaus S.114) Ziel einer Zeitreihenanalyse ist es, aufgrund von Beobachtungen in der Vergangenheit, Strukturen und Gesetzmäßigkeiten aufzudecken um Modelle zu entwickeln, die zukünftige Ereignisse vorhersagen (Haar, 2011, S.27). Praktische Anwendungen sind somit: * das Erstellen von Prognosen, * das Analysieren und somit Erkennen und Verstehen von Ursachen und * die Kontrolle von Prozessen um Abweichung zwischen Ist-und Sollgröße auszugleichen. (Von der Lippe, P.M. S.393/394)

==== Die Zeitreihe ==== Formal gesehen ist eine Zeitreihe eine Messung von Werten einer Variablen Y (z.B. Wetter, Sportlerzahl, Wettkämpfe) die über eine bestimmte Zeit gemessen wird. Die Messwerte sind bestimmten Zeitpunkten zugeordnet. Man erhält so mehrere, diskrete Werte die als **y1, y2, y3,** … bezeichnet werden. Die Zahl im Index steht für den **Zeitpunkt t** (z.B. Tage, Monate, Perioden) der Messung. Der Beobachtungszeitraum der Zeitreihe wird durch **(1:T)** bestimmt (Backhaus S.114).

===== Vorgehensweise bei der Analyse von Zeitreihen ===== {{ :fm:stat:analyseschritte_von_zeitreihen.png?300 |}} ==== 1. Visualisierung ==== Es ist wichtig sich vor jeder Untersuchung eine Bild von der zu analysierenden Zeitreihe zu machen. Die Visualisierung einer Zeitreihe ist eine wichtige Grundlage zur Formulierung eines geeigneten Modells (S.119 Backhaus). Der Graph einer Zeitreihe kann bereits erste Informationen über den Entwicklungsverlauf, sowie Brüche und Ausreißer der Zeitreihe liefern (Von der Lippe. S.395). Passende Darstellungsarten sind z.B. Streudiagramme, Balkendiagramme oder Liniendiagramme, bei denen die Messdaten über die Zeit aufgetragen werden. Siehe Abbildung 1-3 : (S.119 Backhaus) [{{:fm:stat:balkendiagramm.png?300 |Abbildung 1: Balkendiagramm}}] [{{:fm:stat:liniendiagramm.png?300|Abbildung 2: Liniendiagramm}}] [{{:fm:stat:streudiagramm.png?300|Abbildung 3: Streudiagramm}}] ==== 2. Formulierung eines Modells ==== Zeitreihenverläufe können sehr unterschiedliche Formen annehmen. Die Wahl des richtigen Modells ist eine wichtige, jedoch nicht ganz leichte Entscheidung. Ein Grundprinzip bildet die Zeitreihenzerlegung, bei der eine Zeitreihe in unterschiedliche Komponenten zerlegt wird. Man unterscheidet zwischen **Additiver Zeitreihenzerlegung (Y=A+K+S+u)** und** Multiplikativen Zeitreihenzerlegung (Y=A*K*S*u)**. Die Komponenten beider Zerlegungen sind jeweils die Gleichen, sie unterscheiden sich nur hinsichtlich ihrer mathematischen Rechenzeichen. {{ :fm:stat:gleichung_zeitreihe.png?400 |}} Die Prognosevariable Y wird durch die Trendkomponente (A), die Konjunkturkomponente (K) und die Saisonkomponente (S) beeinflusst. Die Trendkomponente A kann ein Wachstum (positiv) oder eine Schrumpfung (negativ) darstellen, sie kann linear oder nichtlinear sein (Backhaus S.120). Die Trendkomponente A ist Ausdruck von nicht periodischen, „langfristigen“ Einflussfaktoren auf Y (Von der Lippe. S.397). K und S sind zyklische Schwankungen und verlaufen daher nichtlinear. A, K und S werden zusammen als //systematische Komponenten// bezeichnet. Die Störgröße (u) ist eine //zufällige Komponente//. //Beispiel:// Bei der oben dargestellten Zeitreihe (Absatzmenge über der Zeit) sind nur kleine Schwankung zu erkennen. Somit fallen die Komponenten K und S weg, da diese für die zyklischen Schwankungen stehen. Unser Modell lautet somit: $Y = A + u$. Da dieses Modell noch zu ungenau ist, soll der Trendparameter A spezifiziert werden. Der Einfachheit halber gehen wir von einem linearen Verlauf aus, auch wenn eine kleine Nichtlinearität bei der Visualisierung (Schritt 1) zu erkennen ist. Lineares Trendmodell: Y = α + β*t + u α und β: Unbekannte Parameter, deren Größe man auf Basis von den bereits bekannten Werten schätzen muss. Trendparameter β: Zuwachs von Y pro Periode (Backhaus S.120) ==== 3. Schätzung eines Modells ==== Zur Schätzung der Parameter α und β wird eine Regressionsanalyse ([[fm:stat:stat05]]) verwendet ( UV = Zeit / AV = Menge). Nach dem Durchführen der Regressionsanalyse erhalten wir folgende Regressionsgleichung: Ŷ = a + b * t = 1619,5 + 120,9 * t (R² = 0,972) b gibt die Steigung an und somit lässt sich aus der Regressionsgleichung ablesen, dass die Absatzmenge pro Periode um 121 Kartons zunimmt. (Backhaus, S.121) ==== 4. Erstellung von Prognosen ==== Zum Erstellen von Prognosen hilft uns die geschätzte Regressionsgleichung. Durch eine kleine Änderung in der Formel lässt sich ein Prognosewert für eine in der Zukunft liegende Prognose bestimmen. Man unterscheidet zwischen Punktprognosen und Intervallprognosen. // Punktprognose:// ŷ T+k= a + b*(T+k) (T+k) = die in der Zukunft liegende Periode //Prognoseintervall ( Konfidenzintervall):// yT+k= ŷT+k± tα/2*sp(T+k) Als Intervall geschrieben: ŷT+k- tα/2*sp(T+k) ≤ yT+k ≥ ŷT+k+ tα/2*sp(T+k) tα/2 = Quantil der t-Verteilung ( Vertrauenswahrscheinlichkeit: 1-α; Freiheitsgrade: T-2; Zweiseitiger t-Test) Wenn man Prognosen erstellt, hat man es auch leider immer mit einem Prognosefehler zu tun. Dieser kann durch folgende Formel herausgerechnet werden: sp(T+k)=√(1/(T-2) ∑_(t=1)^T▒〖et^2 〗)*√(1+1/T+((T+k-t ̅)²)/(∑_t▒〖(t-t ̅)²〗)) s = Standardfehler der Regression t ̅= Mittelwert der Zeitvariablen t st= Standardabweichung der Zeitvariablen t Anhand des Prognosefehlers, zu unterschiedlichen Perioden, kann eine Entwicklung dieses Fehlers aufgezeigt werden. Aus der Formel zur Berechnung des Prognosefehlers wird ersichtlich, dass dieser mit dem Prognosehorizont (T+k) anwächst. Der geringste Prognosefehler liegt im Mittelpunkt der Zeitreihe vor. (Backhaus S.123) ==== 5. Prüfung der Prognosegüte ==== Eine Prognose basiert auf Schätzungen und kann somit nicht fehlerfrei sein. Da die richtigen Werte zum Zeitpunkt der Prognose nicht bekannt sind, ist eine sofortige Prüfung der erstellten Prognose nicht möglich. Eine Prognose kann durch //Ex-Post-Prognosen// überprüft werden. Dafür wird der Stützbereich für die Schätzung des Modells verkürzt. Auf Basis dieses neuen Stützbereiches wird eine neue Regressionsanalyse durchgeführt und die geschätzten Werte mit den beobachteten Werten verglichen. Zur Beurteilung der //empirischen Prognosegüte// können die Fehlermaße MAD, MAPE und U bestimmt werden. \\ ===== Autokorrelation ===== Die Autokorrelation bildet eine weitere Kenngröße zur Beschreibung einer Zeitreihe. Durch diese Methode erhält man erste Informationen zur seriellen Abhängigkeit der Zeitreihe. Sie überprüft ob eine Abhängigkeit zwischen einer Wiederholungsmessung und der vorausgegangenen Messung besteht (Wilhelm, 1999, S.486). =====Nichtlineares Trendmodell===== Nur selten haben reale Trendverläufe eine lineare Struktur. Bei kurzen Prognosen reicht es eine Näherung über ein lineares Trendmodell zu erstellen. Bei langfristigen Prognosen ist ein //nichtlineares// Trendmodell das geeignete Mittel (Backhaus, S. 126). Bei den nichtlinearen Trendmodellen wird unterschieden zwischen: - Das Quadratwurzel-Modell - Das Logarithmische Modell - Das Multiplikative Modell - Das Potenz-Modell \\ \\ ===== Fragen ===== - ... - ...
alternativ mit Show-Button: Antwort zu Frage 1 ===== Literatur ===== Backhaus, Multivariate Varianzanalyse Dissertation Benjamin Haar, 2011 Von der Lippe, P.M. Zugriff am 30.12.2015 unter http://www.von-der-lippe.org/dokumente/buch/BUCH11.pdf Wilhelm, A. (1999). Zeitreihenanalyse. In Strauß, B., Haag, H. & Kolb, M. (Hrsg.), Datenanalyse in der Sportwissenschaft ( S.481-502). Schorndorf: Hofmann.

{{indexmenu_n>12}}