Veranstaltung | Seminar Quantitative Forschungsmethoden |
---|---|
Thema | Faktorenanlyse |
Autoren | Yannic Schorr & Alexander Otto |
Bearbeitungsdauer | 45 min |
Letzte Bearbeitung | 27.02.2015 |
Status | finalisiert |
Die Faktorenanalyse (oder auch Faktoranalyse) ist ein Analyseinstrument aus dem Bereich der multivariaten Statistik. Ziel einer Faktorenanalyse ist es, eine größere, empirisch erhobene Datenmenge auf ein Mindestmaß zu reduzieren, um nachfolgend aufklärende Faktoren zu generieren. Gängige Beispiele sind etwa die Konstrukte Motivation, Intelligenz, Kreativität oder Qualifikation. Dementsprechend wird die Faktorenanalyse auch meistens dort eingesetzt, wo eine Vielzahl von Items oder Variablen eine Fragestellung beantworten soll. Differenziert werden kann die Faktorenanalyse in die konfirmatorische und explorative Faktorenanalyse. Der Unterschied zwischen den beiden genannten Varianten kann ergänzend hier nachgelesen werden. Link
Als Anwendungsvoraussetzungen nennen Bös et al. (2004) die folgenden Punkte:
1. Die Variablen sollten intervallskaliert sein.
2. Die Daten sollten normalverteilt sein.
3. Zwischen den Variablen sollten lineare Zusammenhänge bestehen.
Wirtz und Nachtigall (2004) fassen die Ziele einer Faktorenanalyse wie folgt zusammen:
1. Reduktion der Variablenanzahl: Die Faktorenanalyse erkennt Variablengruppen, in denen jeweils alle Variablen ähnliche Informationen erfassen. Werden die Variablen innerhalb jeder homogenen Gruppe zusammengefasst, ergibt sich eine ökonomischere Darstellung der Gesamtinformation.
2. Ermittlung verlässlicher Messgrößen: Werden die Variablen zu einem Faktor zusammengefasst, so besitzt dieser Faktor günstigere messtechnische Eigenschaften als die einzelnen Variablen.
3. Analytische Zielsetzung: Die Faktorenanalyse ermöglicht es, von den manifesten Variablen (den Indikatorvariablen) auf übergeordnete latente Variablen (z. B. Intelligenz) zu schließen.
verfasst von Yannic Schorr
Mit Hilfe eines Fragebogens soll herausgefunden werden, welche Beweggründe eine Personengruppe hat, einer gewissen Tätigkeit nachzukommen. Um nun Rückschlüsse zu bekommen, warum die Personen die Tätigkeit ausführen, wurden insgesamt 30 Items bestimmt. Die Bestimmung solcher Items kann z.B. durch Literaturrecherche, aber auch durch situativ angepasstes logisches Denken in Bezug auf die jeweilige Situation erfolgen. Die Aussagen der aufgestellten Items (z.B. „Die Tätigkeit macht mir Spaß“) sollten von den befragten Personen mit Hilfe einer 5er-Likert-Skala bewertet werden, wie sehr die einzelnen Aussagen auf sie selbst zutreffend sind (von „trifft voll zu“ bis „trifft gar nicht zu“). Wichtig ist hierbei, dass sowohl bei der Formulierung der Items, als auch bei der Bewertungsskala auf eine eindeutige Wortwahl geachtet wird. Eine Bewertung wie etwa „trifft ein bisschen zu“, kann zu Verständnisproblemen beim Ausfüllen der Fragebögen führen und so das Ergebnis verzerren.
Im vorliegenden Beispiel wurde der Fragebogen von einer Stichprobe von 59 Personen ausgefüllt, was bereits einer recht großen Datenmenge entspricht. Mit Hilfe der Faktorenanalyse ist es nun möglich, aufgrund von Korrelationsberechnungen zwischen den einzelnen Items zu berechnen, welche der Items miteinander verbunden sind (also stark miteinander korrelieren) und wie viel der Varianz sie zusammen aufklären. Letztendlich ist es nach der Durchführung der Faktorenanalyse möglich, Faktoren zu bestimmen und somit eine kleinere Datenmenge zu generieren, diese zu interpretieren und somit eine haltbare Aussage zu bekommen, was die befragte Personengruppe antreibt, der Tätigkeit nachzukommen.
verfasst von Yannic Schorr
Eine Möglichkeit, eine Faktorenanalyse durchzuführen, bietet die Statistik- und Analysesoftware SPSS der Firma IBM (andere Programme sind auch möglich), worauf sich auch die folgenden Ausführungen beziehen. Um die Analyse durchführen zu können, ist es zunächst notwendig, die Daten sorgfältig in das Programm einzugeben. Hierzu bietet SPSS zwei Ansichten. Abb. 1 zeigt die Variablenansicht. Hier werden die entsprechenden Variablen definiert (etwa das Skalenniveau oder die Beschriftung). Die eigentliche Dateneingabe erfolgt in der Datenansicht. Diese ist in Abb. 2 dargestellt. Hier werden die einzelnen Messergebnisse zu den jeweiligen Variablen eingegeben (in Abb. 2 sind beispielhaft die Werte für die erste Variable markiert).
Abb. 1: Eingabe der einzelnen Variablen (SPSS-Screenshot).
Abb. 2: Bewertungen der einzelnen Items durch die befragten Personen (SPSS-Screenshot).
Über den Befehl Analysieren –> Dimensionsreduktion –> Faktorenanalyse lässt sich in SPSS die gesuchte Berechnung (in diesem Fall die Faktorenanalyse) ansteuern. Nachfolgend bietet SPSS die üblichen deskriptiven Auswertungen, sowie einige Einstellungen zur Durchführung der Faktorenanalyse. Zunächst ist hier erwähnenswert, dass die Bestimmung, ab welchem Eigenwert ein Faktor generiert wird, erfolgt. Hierfür gibt es verschiedene Aussagen. Backhaus et al. (2011) empfehlen hier das Kaiser-Kriterium. Dieses besagt, dass ein Faktor erst dann generiert wird, sobald er durch die Analyse auf einen Eigenwert von > 1 kommt. Hintergrund ist, dass ein Faktor erst ab einen Eigenwert von > 1 mehr erklärt, als ein einzelnes Item (bei SPSS ist der Wert 1 bereits voreingestellt). Außerdem kann zuvor noch ausgewählt werden, ob die Ergebnisse in rotierter Form dargestellt werden sollen. Der Vorteil von rotierten Ergebnissen (etwa durch die Varimax-Methode) ist, dass die Ladung einzelner Items auf einen Faktor deutlicher ausfallen, was im Anschluss eine inhaltliche Interpretation erleichtert (Schendera, 2010).
verfasst von Alexander Otto
Ist die Faktorenanalyse erfolgreich angesteuert worden, erhält man von SPSS einen Ergebnisexport. Je nachdem welche Informationen man angefordert hat, etwa einen Teil zur deskriptiven Statistik, werden diese Informationen nun angezeigt. Für die Faktorenanalyse ist zunächst wichtig zu wissen, wie viele Faktoren nun überhaupt generiert wurden. Dies wird in Tab. 1 angezeigt. Die Tabelle besteht aus insgesamt 30 Zeilen (entsprechend der aus dem Beispiel angesprochenen Items). Diese Zeilen stellen die theoretisch zur Verfügung stehenden Faktoren dar. Da nun aber zu Beginn aufgrund des erwähnten Kaiser-Kriteriums festgelegt wurde, dass lediglich Faktoren ab einem Eigenwert von > 1 Bedeutung finden sollen, werden nur für die ersten neun Zeilen (Faktoren) auch Werte für die Spalten Summen von quadrierten Faktorladungen für Extraktion und Rotierte Summe der quadrierten Ladungen ausgewiesen. Die restlichen, von SPSS berechneten Faktoren 10 bis 30 haben alle einen Eigenwert von < 1 und
weisen somit weniger Aufklärungsvarianz aus, als ein einzelnes Item. Daher werden diese in späteren Berechnungen nicht mehr berücksichtigt.
In der Spalte % der Varianz wird jeweils angezeigt, wie viel Aufklärungsvarianz die einzelnen berechneten Faktoren aufweisen. In der Spalte Kumulierte % werden dann die Aufklärungsvarianzen der Faktoren zusammengerechnet. Faktor 1 erklärt 26,221 % der Varianz. Zusammen mit dem Faktor 2 bereits 36,707 %, usw..
Die Spalte % der Varianz weist gleichzeitig die einzelnen Aufklärungsvarianzen der generierten Faktoren aus. Hier wird deutlich, dass der Faktor 9 mit 3,727 % deutlich weniger Aufklärungsvarianz aufweist als etwa der Faktor 5 mit 5,15 %.
Tab. 1: Erklärte Gesamtvarianz
Komponente | Anfängliche Eigenwerte | Summen von quadrierten Faktorladungen für Extraktion | Rotierte Summe der quadrierten Ladungen | ||||||
---|---|---|---|---|---|---|---|---|---|
Gesamt | % der Varianz | Kumulierte % | Gesamt | % der Varianz | Kumulierte % | Gesamt | % der Varianz | Kumulierte % | |
1 | 7,866 | 26,221 | 26,221 | 7,866 | 26,221 | 26,221 | 3,374 | 11,248 | 11,248 |
2 | 3,146 | 10,486 | 36,707 | 3,146 | 10,486 | 36,707 | 3,360 | 11,200 | 22,447 |
3 | 2,886 | 9,621 | 46,329 | 2,886 | 9,621 | 46,329 | 2,977 | 9,922 | 32,369 |
4 | 1,833 | 6,109 | 52,438 | 1,833 | 6,109 | 52,438 | 2,471 | 8,235 | 40,604 |
5 | 1,545 | 5,150 | 57,589 | 1,545 | 5,150 | 57,589 | 2,454 | 8,179 | 48,783 |
6 | 1,473 | 4,910 | 62,499 | 1,473 | 4,910 | 62,499 | 2,438 | 8,127 | 56,910 |
7 | 1,338 | 4,459 | 66,958 | 1,338 | 4,459 | 66,958 | 2,004 | 6,678 | 63,588 |
8 | 1,211 | 4,036 | 70,994 | 1,211 | 4,036 | 70,994 | 1,797 | 5,991 | 69,579 |
9 | 1,118 | 3,727 | 74,721 | 1,118 | 3,727 | 74,721 | 1,543 | 5,142 | 74,721 |
10 | ,953 | 3,178 | 77,898 | ||||||
11 | ,849 | 2,829 | 80,728 | ||||||
12 | ,731 | 2,438 | 83,166 | ||||||
13 | ,700 | 2,333 | 85,499 | ||||||
14 | ,562 | 1,874 | 87,373 | ||||||
15 | ,541 | 1,802 | 89,175 | ||||||
16 | ,494 | 1,647 | 90,822 | ||||||
17 | ,428 | 1,426 | 92,248 | ||||||
18 | ,370 | 1,234 | 93,482 | ||||||
19 | ,357 | 1,190 | 94,672 | ||||||
20 | ,335 | 1,118 | 95,790 | ||||||
21 | ,270 | ,900 | 96,690 | ||||||
22 | ,213 | ,711 | 97,401 | ||||||
23 | ,155 | ,515 | 97,917 | ||||||
24 | ,129 | ,432 | 98,348 | ||||||
25 | ,127 | ,424 | 98,772 | ||||||
26 | ,104 | ,345 | 99,118 | ||||||
27 | ,091 | ,302 | 99,420 | ||||||
28 | ,069 | ,229 | 99,648 | ||||||
29 | ,064 | ,214 | 99,863 | ||||||
30 | ,041 | ,137 | 100,000 |
Nachdem die Faktorenanzahl bestimmt wurde, müssen diese nun inhaltlich interpretiert werden. SPSS stellt hierfür Tab. 2 der rotierten Komponentenmatrix zur Verfügung. Hier wird angegeben, wie stark jedes einzelne Item mit den neun berechneten Faktoren zusammenhängt. Man spricht hierbei davon, wie sehr ein Item auf einen Faktor lädt. Tab. 2 zeigt nun in sortierter Art und Weise, auf welchen Faktor ein Item am meisten lädt. Durch die Sortierung der Ergebnisse kann sehr schnell festgestellt werden, durch wie viele einzelne Items ein Faktor bestimmt wird. Faktor 1, welcher, wie zuvor bereits festgestellt, mit 26,221 % einen Großteil der Aufklärungsvarianz bestimmt, wird durch insgesamt 5 Items erklärt. Die angesprochene Rotation der Ergebnisse kommt nun an diesem Punkt besonders zum Tragen, denn die ausgewählte Rotation der Varimax hat zu Folge, dass die Ladungen der Items auf die Faktoren deutlicher ausfallen, was nun eine Interpretation dieser erleichtert. Da nun bekannt ist, welche Items zusammen einen Faktor bestimmen, können diese inhaltlich interpretiert werden, denn SPSS kann lediglich Berechnungen auf Basis von Daten erheben, aber keine Deutung der Inhalte vornehmen. Wie bereits erwähnt, wird der Faktor 1 durch 5 Items bestimmt, welche etwa lauten könnten „Die Arbeit macht mit Spaß“, „Ich gehe gerne zur Arbeit“, „Ich freue mich auf einen Arbeitstag“, „Das Arbeitsklima ist angenehm“ und „Meine Kollegen sind freundlich zu mir“. Fasst man diese nun inhaltlich zusammen könnte man den Faktor 1 etwa „Spaß und Freude bei der Tätigkeit und angenehmes Arbeitsklima“ nennen. Wobei dies nur eine Möglichkeit darstellt. Das muss nun für alle berechneten Faktoren durchgeführt werden.
Tab. 2: Rotierte Komponentenmatrix (sortiert)
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | |
---|---|---|---|---|---|---|---|---|---|
Spaß | etc. | etc. | etc. | etc. | etc. | etc. | etc. | etc. | |
Itembezeichnung | ,875 | ,091 | ,050 | ,100 | ,131 | -,068 | ,030 | ,053 | -,023 |
Itembezeichnung | ,816 | ,090 | ,012 | ,036 | ,028 | ,015 | ,290 | -,063 | -,186 |
Itembezeichnung | ,642 | ,240 | -,190 | ,338 | ,182 | ,177 | -,105 | ,090 | ,077 |
Itembezeichnung | ,638 | ,080 | ,141 | ,112 | ,369 | ,229 | -,068 | ,076 | ,245 |
Itembezeichnung | ,413 | ,153 | -,176 | ,369 | ,408 | ,306 | -,069 | ,071 | ,191 |
Itembezeichnung | ,043 | ,882 | ,046 | ,083 | ,129 | -,029 | ,062 | -,093 | -,081 |
Itembezeichnung | ,206 | ,851 | -,031 | -,003 | -,069 | -,065 | ,219 | ,154 | ,069 |
Itembezeichnung | -,031 | ,601 | ,274 | -,039 | ,512 | ,047 | ,100 | ,249 | -,062 |
Itembezeichnung | ,345 | ,571 | ,220 | ,061 | ,094 | ,285 | ,048 | ,137 | -,006 |
Itembezeichnung | ,186 | ,384 | ,258 | ,360 | ,230 | ,365 | ,071 | -,032 | -,124 |
Itembezeichnung | -,008 | ,052 | ,881 | ,094 | -,049 | -,057 | ,046 | ,058 | -,001 |
Itembezeichnung | ,160 | ,095 | ,859 | ,128 | -,076 | ,185 | ,031 | ,008 | ,149 |
Itembezeichnung | -,014 | ,297 | ,601 | ,107 | ,311 | ,204 | -,017 | ,060 | -,284 |
Itembezeichnung | -,255 | -,086 | ,581 | ,270 | ,090 | -,002 | ,353 | ,348 | ,120 |
Itembezeichnung | ,288 | -,092 | ,184 | ,756 | ,200 | -,108 | -,181 | -,128 | -,041 |
Itembezeichnung | ,194 | ,136 | ,226 | ,711 | -,010 | ,067 | ,102 | ,351 | ,136 |
Itembezeichnung | -,180 | ,433 | ,119 | ,555 | -,093 | ,224 | ,257 | ,083 | -,087 |
Itembezeichnung | -,265 | -,053 | ,326 | -,060 | -,706 | ,109 | -,092 | ,066 | -,018 |
Itembezeichnung | ,310 | ,185 | ,221 | ,053 | ,688 | ,153 | ,313 | ,182 | ,074 |
Itembezeichnung | ,220 | -,014 | ,209 | ,447 | ,514 | ,308 | -,015 | ,238 | -,200 |
Itembezeichnung | ,018 | ,075 | -,103 | -,100 | -,197 | ,786 | ,059 | ,238 | -,034 |
Itembezeichnung | ,003 | -,198 | ,290 | ,205 | ,206 | ,666 | -,011 | -,112 | ,189 |
Itembezeichnung | ,062 | ,067 | ,188 | ,335 | ,409 | ,588 | ,005 | -,118 | ,293 |
Itembezeichnung | ,404 | ,244 | ,098 | -,062 | ,191 | ,543 | ,097 | ,334 | -,104 |
Itembezeichnung | -,017 | ,127 | ,136 | -,145 | ,131 | ,139 | ,788 | ,395 | -,094 |
Itembezeichnung | ,161 | ,493 | ,013 | ,011 | ,049 | -,078 | ,714 | -,050 | -,091 |
Itembezeichnung | ,248 | ,021 | ,051 | ,333 | ,204 | ,068 | ,571 | -,298 | ,357 |
Itembezeichnung | ,047 | ,072 | ,125 | ,080 | ,076 | ,102 | ,094 | ,803 | ,038 |
Itembezeichnung | ,187 | ,429 | -,057 | ,217 | ,071 | ,099 | -,066 | ,442 | ,318 |
Itembezeichnung | -,059 | -,056 | ,051 | -,022 | ,011 | ,070 | -,025 | ,083 | ,896 |
verfasst von Alexander Otto
Die Faktorenanalyse wird häufig als statistisches Instrument zur Datenreduktion genutzt. Es wird ermöglicht, aus einer größeren Anzahl von Items wenige Faktoren zu generieren. Das aufgezeigte Beispiel zeigte eine Möglichkeit zur Durchführung einer Faktorenanalyse mit dem Programm SPSS. Es wurde schrittweise erklärt, wie aus 30 einzelnen Items insgesamt neun aufklärende Faktoren berechnet wurden, welche die Frage nach der Motivation für eine Tätigkeit erklären.
verfasst von Yannic Schorr
Die Faktorenanalyse wird oft in Verbindung mit einer Regressionsanalyse genutzt. Ziel einer Regressionsanalyse ist es, Zusammenhänge zwischen mehreren unabhängigen und einer abhängigen Variable aufzuklären. Eine Faktorenanalyse kann hierbei genutzt werden, um die zur Verfügung stehenden Variablen zusammenzufassen und zu strukturieren, um mit den berechneten Faktoren die Regressionsanalyse durchzuführen. Die Regressionsanalyse würde in einem solchen Fall prüfen welchen Zusammenhang die Faktoren mit der abhängigen Variable hat.
verfasst von Alexander Otto
Das folgende Video zeigt ein weiteres Beispiel zur Durchführung einer Faktorenanalyse.
1. Warum werden Faktoren mit einem berechneten Eigenwert von < 1 aussortiert und womit wird dieses Vorgehen begründet?
<spoiler | Antwort> Faktoren mit einem Eigenwert < 1 werden aussortiert, da sie weniger Aussagekraft haben als ein einzelnes Item. Begründet wird dieses Vorgehen mit dem Kaiser-Kriterium, welches besagt, dass ein Faktor erst ab einem Eigenwert > 1 mehr als ein einzelnes Item erklärt. </spoiler>
2. Was ist der Vorteil von rotierten Ergebnissen?
<spoiler | Antwort> Der Vorteil von rotierten Ergebnissen ist, dass die Ladungen einzelner Items deutlicher ausfallen. Dies erleichtert im Anschluss die inhaltliche Interpretation der Ergebnisse. </spoiler>
3. Welche (sportbezogene) Fragestellung könnte man noch mit einer Faktorenanalyse untersuchen?
<spoiler | Antwort> Was bewegt einen Kunden einen bestimmten Fußballschuh zu kaufen?
Welche Beweggründe gibt es, mit einer neuen Sportart anzufangen?
Was könnten Gründe für einen Vereinswechsel sein? </spoiler>
verfasst von Yannic Schorr
Backhaus, K., Erichson, B., Plinke, W. & Weiber, R. (2011). Multivariate Analysemethoden. Eine anwendungsorientierte Einführung. Heidelberg: Springer.
Bös, K., Hänsel, F. & Schott, N. (2004). Empirische Untersuchungen in der Sportwissenschaft. Planung - Auswertung - Statistik. Hamburg: Czwalina.
Brosius, F. (2011). SPSS 19. Heidelberg: mitp.
Kähler, W.-M. (2002). Statistische Datenanalyse. Verfahren verstehen und mit SPSS gekonnt einsetzen. Braunschweig: Vieweg.
Schendera, C.F.G. (2010). Clusteranalyse mit SPSS. Mit Faktorenanalyse. München: Oldenbourg.
Wirtz, M. & Nachtigall, C. (2004). Deskriptive Statistik. Weinheim: Juventa.
http://mars.wiwi.hu-berlin.de/mediawiki/mmstat_de/index.php/Faktoranalyse_-_AQM-Faktoranalyse-konfexpl (letzter Zugriff: 16.01.2015)
https://www.youtube.com/watch?v=kyGvk4eSuJE (letzter Zugriff: 16.01.2015)
Bewertung des Wiki-Moduls
Kategorie | Otto | Schorr | Anmerkungen |
---|---|---|---|
Inhalt (max. 10) | 8 Pkt | 8 Pkt | Inhaltlich gut. Möglichkeiten und Nutzen in Bezug auf Forschungsfrage könnten mehr herausgestellt werden. |
Form (max. 5) | 4 Pkt | 4 Pkt | gut Verständlich, Tabellen etwas viel, Video gut |
Bonus (max. 2) | 0 Pkt | 0 Pkt | |
Summe | 12 Pkt | 12 Pkt | |
Einzelbewertung | 12/15= 80% | 12/15= 80% | 24/30= 80% |