Kovarianz in der Statistik: Was ist das? Beispiel

Teilen auf

Inhalt (Klicken, um zu diesem Abschnitt zu springen):


  1. Definition & Formel
  2. Beispiel
  3. Probleme bei der Interpretation
  4. Vorteile
  5. Kovarianz in Excel

Definition & Formel

Kovarianz ist ein Maß dafür, wie stark zwei Zufallsvariablen zusammen variieren. Es ist ähnlich wie Varianz, aber wo Varianz sagt Ihnen, wie eine einzelne Variable variiert, co Varianz sagt Ihnen, wie zwei Variablen zusammen variieren.

 Kovarianz

Bild von U von Wisconsin.


Die Kovarianzformel

Sehen Sie sich das Video für ein Beispiel an:

Kann das Video nicht sehen? Klicken Sie hier.

Die Formel lautet:
Cov(X,Y) = Σ E((X – μ) E(Y – ν)) / n-1 wobei:

  • X ist eine Zufallsvariable
  • E(X) = μ ist der erwartete Wert (der Mittelwert) der Zufallsvariablen X und
  • E(Y) = ν ist der erwartete Wert (der Mittelwert) der Zufallsvariablen Y
  • n = die Anzahl der Elemente im Datensatz.
  • Σ Summationsnotation.

Zurück nach oben

Beispiel

Berechnen Sie die Kovarianz für den folgenden Datensatz:
x: 2,1, 2,5, 3,6, 4,0 (Mittelwert = 3,1)
y: 8, 10, 12, 14 (Mittelwert = 11)

Setzen Sie die Werte in die Formel ein und lösen Sie:
Cov(X, Y) = ΣE((X-μ)(Y-ν)) / n-1
= (2.1-3.1)(8-11)+(2.5-3.1)(10-11)+(3.6-3.1)(12-11)+(4.0-3.1)(14-11) /(4-1)
= (-1)(-3) + (-0.6)(-1)+(.5)(1)+(0.9)(3) / 3
= 3 + 0.6 + .5 + 2.7 / 3
= 6.8/3
= 2.267

Das Ergebnis ist positiv, was bedeutet, dass die Variablen positiv verwandt sind.

Hinweis zur Division durch n oder n-1:
Bei Stichproben gibt es n-1 Terme, die frei variieren können (siehe: Freiheitsgrade). Wenn Sie die Kovarianz von nur zwei Zufallsvariablen finden, dividieren Sie einfach durch n.
Zurück zum Anfang

Probleme bei der Interpretation

Eine große Kovarianz kann eine starke Beziehung zwischen Variablen bedeuten. Sie können jedoch keine Abweichungen über Datensätze mit unterschiedlichen Maßstäben (wie Pfund und Zoll) vergleichen. Eine schwache Kovarianz in einem Datensatz kann in einem anderen Datensatz mit unterschiedlichen Skalen stark sein.

Das Hauptproblem bei der Interpretation besteht darin, dass die große Bandbreite der Ergebnisse, die sie annimmt, die Interpretation erschwert. Ihr Datensatz könnte beispielsweise den Wert 3 oder 3.000 zurückgeben. Diese breite Palette von Werten wird durch eine einfache Tatsache verursacht; Je größer die X- und Y-Werte sind, desto größer ist die Kovarianz. Ein Wert von 300 sagt uns, dass die Variablen korreliert sind, aber im Gegensatz zum Korrelationskoeffizienten sagt uns diese Zahl nicht genau, wie stark diese Beziehung ist. Das Problem kann behoben werden, indem die Kovarianz durch die Standardabweichung dividiert wird, um den Korrelationskoeffizienten zu erhalten.
Corr(X,Y) = Cov(X,Y) / σXσY
Zurück zum Anfang

Vorteile des Korrelationskoeffizienten

Der Korrelationskoeffizient hat mehrere Vorteile gegenüber der Kovarianz zur Bestimmung der Stärken von Beziehungen:

  • Die Kovarianz kann praktisch jede Zahl annehmen, während eine Korrelation begrenzt ist: -1 bis +1.
  • Aufgrund ihrer numerischen Einschränkungen ist die Korrelation nützlicher, um zu bestimmen, wie stark die Beziehung zwischen den beiden Variablen ist.
  • Korrelation hat keine Einheiten. Die Kovarianz hat immer Einheiten
  • Die Korrelation wird nicht durch Änderungen im Zentrum (d. H. Mittelwert) oder Skalierung der Variablen

Zurück nach oben

Kovarianz in Excel berechnen

Sehen Sie sich das Video an oder führen Sie die folgenden Schritte aus (dies gilt für Excel 2013, die Schritte sind jedoch für Excel 2016):

Kovarianz in Excel: Übersicht

Die Kovarianz gibt Ihnen eine positive Zahl, wenn die Variablen positiv verwandt sind. Sie erhalten eine negative Zahl, wenn sie negativ verwandt sind. Eine hohe Kovarianz zeigt grundsätzlich an, dass eine starke Beziehung zwischen den Variablen besteht. Ein niedriger Wert bedeutet, dass eine schwache Beziehung besteht.

Kovarianz in Excel: Schritte

Schritt 1: Geben Sie Ihre Daten in zwei Spalten in Excel ein. Geben Sie beispielsweise Ihre X-Werte in Spalte A und Ihre Y-Werte in Spalte B ein.

Schritt 2: Klicken Sie auf die Registerkarte „Daten“ und dann auf „Datenanalyse.“ Das Datenanalysefenster wird geöffnet.

Schritt 3: Wählen Sie „Kovarianz“ und klicken Sie dann auf „OK.“

Schritt 4: Klicken Sie auf „Eingabebereich“ und wählen Sie dann alle Ihre Daten aus. Fügen Sie Spaltenüberschriften hinzu, wenn Sie sie haben.

Schritt 5: Klicken Sie auf das Kontrollkästchen „Beschriftungen in der ersten Zeile“, wenn Sie Spaltenüberschriften in Ihre Datenauswahl aufgenommen haben.

Schritt 6: Wählen Sie „Ausgabebereich“ und dann einen Bereich auf dem Arbeitsblatt aus. Ein guter Ort zur Auswahl ist ein Bereich rechts neben Ihrem Datensatz.

Schritt 7: Klicken Sie auf „OK.“ Die Kovarianz wird in dem Bereich angezeigt, den Sie in Schritt 5 ausgewählt haben.

Kovarianz in Excel 2013

Das war’s!

Tipp: Führen Sie die Korrelationsfunktion in Excel aus, nachdem Sie die Kovarianz in Excel 2013 ausgeführt haben. Korrelation gibt Ihnen einen Wert für die Beziehung. 1 ist perfekte Korrelation und 0 ist keine Korrelation. Alles, was Sie wirklich aus der Kovarianz erkennen können, ist, ob es eine positive oder negative Beziehung gibt.

Weitere Excel-Tipps und Hilfe finden Sie auf unserem YouTube-Kanal!

Zurück nach oben

Dodge, Y. (2008). Die Concise Encyclopedia of Statistics. Springer.
Everitt, BS; Skrondal, A. (2010), Das Cambridge Wörterbuch der Statistik, Cambridge University Press.
Gonick, L. (1993). Der Cartoon-Leitfaden für Statistiken. HarperPerennial.

ZITIEREN SIE DIES ALS:
Stephanie Glen. „Kovarianz in der Statistik: Was ist das? Beispiel“ Von StatisticsHowTo.com: Elementare Statistiken für den Rest von uns! https://www.statisticshowto.com/probability-and-statistics/statistics-definitions/covariance/

—————————————————————————

 Benötigen Sie Hilfe bei einer Hausaufgabe oder Testfrage? Mit Chegg Study erhalten Sie Schritt-für-Schritt-Lösungen für Ihre Fragen von einem Experten auf diesem Gebiet. Deine ersten 30 Minuten mit einem Chegg Tutor sind kostenlos!

Benötigen Sie Hilfe bei einer Hausaufgabe oder Testfrage? Mit Chegg Study erhalten Sie Schritt-für-Schritt-Lösungen für Ihre Fragen von einem Experten auf diesem Gebiet. Deine ersten 30 Minuten mit einem Chegg Tutor sind kostenlos!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.