QFM12 Faktorenanalyse

Veranstaltung Seminar Quantitative Forschungsmethoden
Thema Faktorenanlyse
Autoren Yannic Schorr & Alexander Otto
Bearbeitungsdauer 45 min
Letzte Bearbeitung 27.02.2015
Status finalisiert


Einleitung

Die Faktorenanalyse (oder auch Faktoranalyse) ist ein Analyseinstrument aus dem Bereich der multivariaten Statistik. Ziel einer Faktorenanalyse ist es, eine größere, empirisch erhobene Datenmenge auf ein Mindestmaß zu reduzieren, um nachfolgend aufklärende Faktoren zu generieren. Gängige Beispiele sind etwa die Konstrukte Motivation, Intelligenz, Kreativität oder Qualifikation. Dementsprechend wird die Faktorenanalyse auch meistens dort eingesetzt, wo eine Vielzahl von Items oder Variablen eine Fragestellung beantworten soll. Differenziert werden kann die Faktorenanalyse in die konfirmatorische und explorative Faktorenanalyse. Der Unterschied zwischen den beiden genannten Varianten kann ergänzend hier nachgelesen werden. Link

Als Anwendungsvoraussetzungen nennen Bös et al. (2004) die folgenden Punkte:

1. Die Variablen sollten intervallskaliert sein.
2. Die Daten sollten normalverteilt sein.
3. Zwischen den Variablen sollten lineare Zusammenhänge bestehen.

Wirtz und Nachtigall (2004) fassen die Ziele einer Faktorenanalyse wie folgt zusammen:

1. Reduktion der Variablenanzahl: Die Faktorenanalyse erkennt Variablengruppen, in denen jeweils alle Variablen ähnliche Informationen erfassen. Werden die Variablen innerhalb jeder homogenen Gruppe zusammengefasst, ergibt sich eine ökonomischere Darstellung der Gesamtinformation.
2. Ermittlung verlässlicher Messgrößen: Werden die Variablen zu einem Faktor zusammengefasst, so besitzt dieser Faktor günstigere messtechnische Eigenschaften als die einzelnen Variablen.
3. Analytische Zielsetzung: Die Faktorenanalyse ermöglicht es, von den manifesten Variablen (den Indikatorvariablen) auf übergeordnete latente Variablen (z. B. Intelligenz) zu schließen.

verfasst von Yannic Schorr



Einführendes Beispiel

Mit Hilfe eines Fragebogens soll herausgefunden werden, welche Beweggründe eine Personengruppe hat, einer gewissen Tätigkeit nachzukommen. Um nun Rückschlüsse zu bekommen, warum die Personen die Tätigkeit ausführen, wurden insgesamt 30 Items bestimmt. Die Bestimmung solcher Items kann z.B. durch Literaturrecherche, aber auch durch situativ angepasstes logisches Denken in Bezug auf die jeweilige Situation erfolgen. Die Aussagen der aufgestellten Items (z.B. „Die Tätigkeit macht mir Spaß“) sollten von den befragten Personen mit Hilfe einer 5er-Likert-Skala bewertet werden, wie sehr die einzelnen Aussagen auf sie selbst zutreffend sind (von „trifft voll zu“ bis „trifft gar nicht zu“). Wichtig ist hierbei, dass sowohl bei der Formulierung der Items, als auch bei der Bewertungsskala auf eine eindeutige Wortwahl geachtet wird. Eine Bewertung wie etwa „trifft ein bisschen zu“, kann zu Verständnisproblemen beim Ausfüllen der Fragebögen führen und so das Ergebnis verzerren.
Im vorliegenden Beispiel wurde der Fragebogen von einer Stichprobe von 59 Personen ausgefüllt, was bereits einer recht großen Datenmenge entspricht. Mit Hilfe der Faktorenanalyse ist es nun möglich, aufgrund von Korrelationsberechnungen zwischen den einzelnen Items zu berechnen, welche der Items miteinander verbunden sind (also stark miteinander korrelieren) und wie viel der Varianz sie zusammen aufklären. Letztendlich ist es nach der Durchführung der Faktorenanalyse möglich, Faktoren zu bestimmen und somit eine kleinere Datenmenge zu generieren, diese zu interpretieren und somit eine haltbare Aussage zu bekommen, was die befragte Personengruppe antreibt, der Tätigkeit nachzukommen.

verfasst von Yannic Schorr



Durchführung der Faktorenanalyse

Eine Möglichkeit, eine Faktorenanalyse durchzuführen, bietet die Statistik- und Analysesoftware SPSS der Firma IBM (andere Programme sind auch möglich), worauf sich auch die folgenden Ausführungen beziehen. Um die Analyse durchführen zu können, ist es zunächst notwendig, die Daten sorgfältig in das Programm einzugeben. Hierzu bietet SPSS zwei Ansichten. Abb. 1 zeigt die Variablenansicht. Hier werden die entsprechenden Variablen definiert (etwa das Skalenniveau oder die Beschriftung). Die eigentliche Dateneingabe erfolgt in der Datenansicht. Diese ist in Abb. 2 dargestellt. Hier werden die einzelnen Messergebnisse zu den jeweiligen Variablen eingegeben (in Abb. 2 sind beispielhaft die Werte für die erste Variable markiert).


Abb. 1: Eingabe der einzelnen Variablen (SPSS-Screenshot).


Abb. 2: Bewertungen der einzelnen Items durch die befragten Personen (SPSS-Screenshot).

Über den Befehl Analysieren –> Dimensionsreduktion –> Faktorenanalyse lässt sich in SPSS die gesuchte Berechnung (in diesem Fall die Faktorenanalyse) ansteuern. Nachfolgend bietet SPSS die üblichen deskriptiven Auswertungen, sowie einige Einstellungen zur Durchführung der Faktorenanalyse. Zunächst ist hier erwähnenswert, dass die Bestimmung, ab welchem Eigenwert ein Faktor generiert wird, erfolgt. Hierfür gibt es verschiedene Aussagen. Backhaus et al. (2011) empfehlen hier das Kaiser-Kriterium. Dieses besagt, dass ein Faktor erst dann generiert wird, sobald er durch die Analyse auf einen Eigenwert von > 1 kommt. Hintergrund ist, dass ein Faktor erst ab einen Eigenwert von > 1 mehr erklärt, als ein einzelnes Item (bei SPSS ist der Wert 1 bereits voreingestellt). Außerdem kann zuvor noch ausgewählt werden, ob die Ergebnisse in rotierter Form dargestellt werden sollen. Der Vorteil von rotierten Ergebnissen (etwa durch die Varimax-Methode) ist, dass die Ladung einzelner Items auf einen Faktor deutlicher ausfallen, was im Anschluss eine inhaltliche Interpretation erleichtert (Schendera, 2010).

verfasst von Alexander Otto



Aufzeigen der Ergebnisse

Ist die Faktorenanalyse erfolgreich angesteuert worden, erhält man von SPSS einen Ergebnisexport. Je nachdem welche Informationen man angefordert hat, etwa einen Teil zur deskriptiven Statistik, werden diese Informationen nun angezeigt. Für die Faktorenanalyse ist zunächst wichtig zu wissen, wie viele Faktoren nun überhaupt generiert wurden. Dies wird in Tab. 1 angezeigt. Die Tabelle besteht aus insgesamt 30 Zeilen (entsprechend der aus dem Beispiel angesprochenen Items). Diese Zeilen stellen die theoretisch zur Verfügung stehenden Faktoren dar. Da nun aber zu Beginn aufgrund des erwähnten Kaiser-Kriteriums festgelegt wurde, dass lediglich Faktoren ab einem Eigenwert von > 1 Bedeutung finden sollen, werden nur für die ersten neun Zeilen (Faktoren) auch Werte für die Spalten Summen von quadrierten Faktorladungen für Extraktion und Rotierte Summe der quadrierten Ladungen ausgewiesen. Die restlichen, von SPSS berechneten Faktoren 10 bis 30 haben alle einen Eigenwert von < 1 und weisen somit weniger Aufklärungsvarianz aus, als ein einzelnes Item. Daher werden diese in späteren Berechnungen nicht mehr berücksichtigt.
In der Spalte % der Varianz wird jeweils angezeigt, wie viel Aufklärungsvarianz die einzelnen berechneten Faktoren aufweisen. In der Spalte Kumulierte % werden dann die Aufklärungsvarianzen der Faktoren zusammengerechnet. Faktor 1 erklärt 26,221 % der Varianz. Zusammen mit dem Faktor 2 bereits 36,707 %, usw..
Die Spalte % der Varianz weist gleichzeitig die einzelnen Aufklärungsvarianzen der generierten Faktoren aus. Hier wird deutlich, dass der Faktor 9 mit 3,727 % deutlich weniger Aufklärungsvarianz aufweist als etwa der Faktor 5 mit 5,15 %.


Tab. 1: Erklärte Gesamtvarianz

Komponente Anfängliche Eigenwerte Summen von quadrierten Faktorladungen für Extraktion Rotierte Summe der quadrierten Ladungen
Gesamt % der Varianz Kumulierte % Gesamt % der Varianz Kumulierte % Gesamt % der Varianz Kumulierte %
1 7,866 26,221 26,221 7,866 26,221 26,221 3,374 11,248 11,248
2 3,146 10,486 36,707 3,146 10,486 36,707 3,360 11,200 22,447
3 2,886 9,621 46,329 2,886 9,621 46,329 2,977 9,922 32,369
4 1,833 6,109 52,438 1,833 6,109 52,438 2,471 8,235 40,604
5 1,545 5,150 57,589 1,545 5,150 57,589 2,454 8,179 48,783
6 1,473 4,910 62,499 1,473 4,910 62,499 2,438 8,127 56,910
7 1,338 4,459 66,958 1,338 4,459 66,958 2,004 6,678 63,588
8 1,211 4,036 70,994 1,211 4,036 70,994 1,797 5,991 69,579
9 1,118 3,727 74,721 1,118 3,727 74,721 1,543 5,142 74,721
10 ,953 3,178 77,898
11 ,849 2,829 80,728
12 ,731 2,438 83,166
13 ,700 2,333 85,499
14 ,562 1,874 87,373
15 ,541 1,802 89,175
16 ,494 1,647 90,822
17 ,428 1,426 92,248
18 ,370 1,234 93,482
19 ,357 1,190 94,672
20 ,335 1,118 95,790
21 ,270 ,900 96,690
22 ,213 ,711 97,401
23 ,155 ,515 97,917
24 ,129 ,432 98,348
25 ,127 ,424 98,772
26 ,104 ,345 99,118
27 ,091 ,302 99,420
28 ,069 ,229 99,648
29 ,064 ,214 99,863
30 ,041 ,137 100,000


Nachdem die Faktorenanzahl bestimmt wurde, müssen diese nun inhaltlich interpretiert werden. SPSS stellt hierfür Tab. 2 der rotierten Komponentenmatrix zur Verfügung. Hier wird angegeben, wie stark jedes einzelne Item mit den neun berechneten Faktoren zusammenhängt. Man spricht hierbei davon, wie sehr ein Item auf einen Faktor lädt. Tab. 2 zeigt nun in sortierter Art und Weise, auf welchen Faktor ein Item am meisten lädt. Durch die Sortierung der Ergebnisse kann sehr schnell festgestellt werden, durch wie viele einzelne Items ein Faktor bestimmt wird. Faktor 1, welcher, wie zuvor bereits festgestellt, mit 26,221 % einen Großteil der Aufklärungsvarianz bestimmt, wird durch insgesamt 5 Items erklärt. Die angesprochene Rotation der Ergebnisse kommt nun an diesem Punkt besonders zum Tragen, denn die ausgewählte Rotation der Varimax hat zu Folge, dass die Ladungen der Items auf die Faktoren deutlicher ausfallen, was nun eine Interpretation dieser erleichtert. Da nun bekannt ist, welche Items zusammen einen Faktor bestimmen, können diese inhaltlich interpretiert werden, denn SPSS kann lediglich Berechnungen auf Basis von Daten erheben, aber keine Deutung der Inhalte vornehmen. Wie bereits erwähnt, wird der Faktor 1 durch 5 Items bestimmt, welche etwa lauten könnten „Die Arbeit macht mit Spaß“, „Ich gehe gerne zur Arbeit“, „Ich freue mich auf einen Arbeitstag“, „Das Arbeitsklima ist angenehm“ und „Meine Kollegen sind freundlich zu mir“. Fasst man diese nun inhaltlich zusammen könnte man den Faktor 1 etwa „Spaß und Freude bei der Tätigkeit und angenehmes Arbeitsklima“ nennen. Wobei dies nur eine Möglichkeit darstellt. Das muss nun für alle berechneten Faktoren durchgeführt werden.


Tab. 2: Rotierte Komponentenmatrix (sortiert)

1 2 3 4 5 6 7 8 9
Spaß etc. etc. etc. etc. etc. etc. etc. etc.
Itembezeichnung ,875 ,091 ,050 ,100 ,131 -,068 ,030 ,053 -,023
Itembezeichnung ,816 ,090 ,012 ,036 ,028 ,015 ,290 -,063 -,186
Itembezeichnung ,642 ,240 -,190 ,338 ,182 ,177 -,105 ,090 ,077
Itembezeichnung ,638 ,080 ,141 ,112 ,369 ,229 -,068 ,076 ,245
Itembezeichnung ,413 ,153 -,176 ,369 ,408 ,306 -,069 ,071 ,191
Itembezeichnung ,043 ,882 ,046 ,083 ,129 -,029 ,062 -,093 -,081
Itembezeichnung ,206 ,851 -,031 -,003 -,069 -,065 ,219 ,154 ,069
Itembezeichnung -,031 ,601 ,274 -,039 ,512 ,047 ,100 ,249 -,062
Itembezeichnung ,345 ,571 ,220 ,061 ,094 ,285 ,048 ,137 -,006
Itembezeichnung ,186 ,384 ,258 ,360 ,230 ,365 ,071 -,032 -,124
Itembezeichnung -,008 ,052 ,881 ,094 -,049 -,057 ,046 ,058 -,001
Itembezeichnung ,160 ,095 ,859 ,128 -,076 ,185 ,031 ,008 ,149
Itembezeichnung -,014 ,297 ,601 ,107 ,311 ,204 -,017 ,060 -,284
Itembezeichnung -,255 -,086 ,581 ,270 ,090 -,002 ,353 ,348 ,120
Itembezeichnung ,288 -,092 ,184 ,756 ,200 -,108 -,181 -,128 -,041
Itembezeichnung ,194 ,136 ,226 ,711 -,010 ,067 ,102 ,351 ,136
Itembezeichnung -,180 ,433 ,119 ,555 -,093 ,224 ,257 ,083 -,087
Itembezeichnung -,265 -,053 ,326 -,060 -,706 ,109 -,092 ,066 -,018
Itembezeichnung ,310 ,185 ,221 ,053 ,688 ,153 ,313 ,182 ,074
Itembezeichnung ,220 -,014 ,209 ,447 ,514 ,308 -,015 ,238 -,200
Itembezeichnung ,018 ,075 -,103 -,100 -,197 ,786 ,059 ,238 -,034
Itembezeichnung ,003 -,198 ,290 ,205 ,206 ,666 -,011 -,112 ,189
Itembezeichnung ,062 ,067 ,188 ,335 ,409 ,588 ,005 -,118 ,293
Itembezeichnung ,404 ,244 ,098 -,062 ,191 ,543 ,097 ,334 -,104
Itembezeichnung -,017 ,127 ,136 -,145 ,131 ,139 ,788 ,395 -,094
Itembezeichnung ,161 ,493 ,013 ,011 ,049 -,078 ,714 -,050 -,091
Itembezeichnung ,248 ,021 ,051 ,333 ,204 ,068 ,571 -,298 ,357
Itembezeichnung ,047 ,072 ,125 ,080 ,076 ,102 ,094 ,803 ,038
Itembezeichnung ,187 ,429 -,057 ,217 ,071 ,099 -,066 ,442 ,318
Itembezeichnung -,059 -,056 ,051 -,022 ,011 ,070 -,025 ,083 ,896

verfasst von Alexander Otto



Zusammenfassung

Die Faktorenanalyse wird häufig als statistisches Instrument zur Datenreduktion genutzt. Es wird ermöglicht, aus einer größeren Anzahl von Items wenige Faktoren zu generieren. Das aufgezeigte Beispiel zeigte eine Möglichkeit zur Durchführung einer Faktorenanalyse mit dem Programm SPSS. Es wurde schrittweise erklärt, wie aus 30 einzelnen Items insgesamt neun aufklärende Faktoren berechnet wurden, welche die Frage nach der Motivation für eine Tätigkeit erklären.

verfasst von Yannic Schorr



Ausblick

Die Faktorenanalyse wird oft in Verbindung mit einer Regressionsanalyse genutzt. Ziel einer Regressionsanalyse ist es, Zusammenhänge zwischen mehreren unabhängigen und einer abhängigen Variable aufzuklären. Eine Faktorenanalyse kann hierbei genutzt werden, um die zur Verfügung stehenden Variablen zusammenzufassen und zu strukturieren, um mit den berechneten Faktoren die Regressionsanalyse durchzuführen. Die Regressionsanalyse würde in einem solchen Fall prüfen welchen Zusammenhang die Faktoren mit der abhängigen Variable hat.

verfasst von Alexander Otto



Exkurs

Das folgende Video zeigt ein weiteres Beispiel zur Durchführung einer Faktorenanalyse.




Fragen

1. Warum werden Faktoren mit einem berechneten Eigenwert von < 1 aussortiert und womit wird dieses Vorgehen begründet?

Antwort


2. Was ist der Vorteil von rotierten Ergebnissen?

Antwort


3. Welche (sportbezogene) Fragestellung könnte man noch mit einer Faktorenanalyse untersuchen?

Antwort

verfasst von Yannic Schorr



Literatur

Backhaus, K., Erichson, B., Plinke, W. & Weiber, R. (2011). Multivariate Analysemethoden. Eine anwendungsorientierte Einführung. Heidelberg: Springer.
Bös, K., Hänsel, F. & Schott, N. (2004). Empirische Untersuchungen in der Sportwissenschaft. Planung - Auswertung - Statistik. Hamburg: Czwalina.
Brosius, F. (2011). SPSS 19. Heidelberg: mitp.
Kähler, W.-M. (2002). Statistische Datenanalyse. Verfahren verstehen und mit SPSS gekonnt einsetzen. Braunschweig: Vieweg.
Schendera, C.F.G. (2010). Clusteranalyse mit SPSS. Mit Faktorenanalyse. München: Oldenbourg.
Wirtz, M. & Nachtigall, C. (2004). Deskriptive Statistik. Weinheim: Juventa.


Onlinequellen

http://mars.wiwi.hu-berlin.de/mediawiki/mmstat_de/index.php/Faktoranalyse_-_AQM-Faktoranalyse-konfexpl (letzter Zugriff: 16.01.2015)

https://www.youtube.com/watch?v=kyGvk4eSuJE (letzter Zugriff: 16.01.2015)





Bewertung des Wiki-Moduls

Kategorie Otto Schorr Anmerkungen
Inhalt (max. 10) 8 Pkt 8 Pkt Inhaltlich gut. Möglichkeiten und Nutzen in Bezug auf Forschungsfrage könnten mehr herausgestellt werden.
Form (max. 5) 4 Pkt 4 Pkt gut Verständlich, Tabellen etwas viel, Video gut
Bonus (max. 2) 0 Pkt 0 Pkt
Summe 12 Pkt 12 Pkt
Einzelbewertung 12/15= 80% 12/15= 80% 24/30= 80%
fm/quant_fometh/ws14_projekte/qfm12.txt · Zuletzt geändert: 15.07.2015 18:59 von Filip Cengic
GNU Free Documentation License 1.3
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0