Covariance dans les statistiques: Qu’est-ce que c’est? Exemple

Partager sur

Contenu (Cliquez pour passer à cette section):


  1. Définition & Formule
  2. Exemple
  3. Problèmes d’interprétation
  4. Avantages
  5. Covariance dans Excel

Définition & Formule

La covariance est une mesure de la variation de deux variables aléatoires ensemble. C’est similaire à la variance, mais là où la variance vous indique comment une seule variable varie, la variance co vous indique comment deux variables varient ensemble.

 Covariance

Image de l’U du Wisconsin.


La formule de covariance

Regardez la vidéo pour un exemple:

Vous ne pouvez pas voir la vidéo? Cliquez ici.

La formule est :
Cov(X, Y) = Σ E((X-μ) E(Y-ν)) / n-1 où:

  • X est une variable aléatoire
  • E(X) = μ est la valeur attendue (la moyenne) de la variable aléatoire X et
  • E(Y) = ν est la valeur attendue (la moyenne) de la variable aléatoire Y
  • n = le nombre d’éléments dans l’ensemble de données.
  • Notation de sommation Σ.

Retour en haut

Exemple

Calculer la covariance pour les données suivantes:
x: 2.1, 2.5, 3.6, 4.0 (moyenne = 3.1)
y: 8, 10, 12, 14 (moyenne = 11)

Remplacer les valeurs dans la formule de calcul et de résoudre:
Cov(X,Y) = ΣE((X-μ)(Y-s)) / n-1
= (2.1-3.1)(8-11)+(2.5-3.1)(10-11)+(3.6-3.1)(12-11)+(4.0-3.1)(14-11) /(4-1)
= (-1)(-3) + (-0.6)(-1)+(.5)(1)+(0.9)(3) / 3
= 3 + 0.6 + .5 + 2.7 / 3
= 6.8/3
= 2.267

Le résultat est positif, ce qui signifie que les variables sont positivement liées.

Remarque sur la division par n ou n-1:
Lorsqu’il s’agit d’échantillons, il existe des termes n-1 qui ont la liberté de varier (voir: Degrés de liberté). Si vous trouvez la covariance de seulement deux variables aléatoires, divisez simplement par n.
Haut de page

Problèmes d’interprétation

Une grande covariance peut signifier une relation forte entre les variables. Cependant, vous ne pouvez pas comparer les écarts sur des ensembles de données avec différentes échelles (comme les livres et les pouces). Une covariance faible dans un ensemble de données peut être forte dans un ensemble de données différent avec des échelles différentes.

Le principal problème de l’interprétation est que le large éventail de résultats qu’elle prend rend l’interprétation difficile. Par exemple, votre ensemble de données peut renvoyer une valeur de 3 ou 3 000. Cette large gamme de valeurs est due à un simple fait; Plus les valeurs X et Y sont grandes, plus la covariance est grande. Une valeur de 300 nous indique que les variables sont corrélées, mais contrairement au coefficient de corrélation, ce nombre ne nous indique pas exactement à quel point cette relation est forte. Le problème peut être résolu en divisant la covariance par l’écart-type pour obtenir le coefficient de corrélation.
Corr(X, Y) = Cov(X, Y)/ σXσY
Haut de page

Avantages du Coefficient de corrélation

Le Coefficient de corrélation présente plusieurs avantages par rapport à la covariance pour déterminer les forces des relations:

  • La covariance peut prendre pratiquement n’importe quel nombre alors qu’une corrélation est limitée : -1 à +1.
  • En raison de ses limites numériques, la corrélation est plus utile pour déterminer la force de la relation entre les deux variables.
  • La corrélation n’a pas d’unités. La covariance a toujours des unités
  • La corrélation n’est pas affectée par les changements au centre (c’est-à-dire moyenne) ou échelle des variables

Haut de page

Calculer la covariance dans Excel

Regardez la vidéo ou suivez les étapes ci-dessous (ceci est pour Excel 2013, mais les étapes sont les mêmes pour Excel 2016):

Covariance dans Excel: Aperçu

La covariance vous donne un nombre positif si les variables sont positivement liées. Vous obtiendrez un nombre négatif s’ils sont liés négativement. Une covariance élevée indique essentiellement qu’il existe une forte relation entre les variables. Une valeur faible signifie qu’il existe une relation faible.

Covariance dans Excel: Étapes

Étape 1: Entrez vos données dans deux colonnes dans Excel. Par exemple, tapez vos valeurs X dans la colonne A et vos valeurs Y dans la colonne B.

Étape 2: Cliquez sur l’onglet « Données », puis cliquez sur « Analyse des données. » La fenêtre d’analyse des données s’ouvrira.

Étape 3: Choisissez « Covariance » puis cliquez sur « OK. »

Étape 4: Cliquez sur « Plage d’entrée », puis sélectionnez toutes vos données. Incluez les en-têtes de colonne si vous en avez.

Étape 5: Cochez la case « Étiquettes dans la première ligne » si vous avez inclus des en-têtes de colonne dans votre sélection de données.

Étape 6: Sélectionnez « Plage de sortie », puis sélectionnez une zone sur la feuille de calcul. Un bon endroit pour sélectionner est une zone située juste à droite de votre ensemble de données.

Étape 7: Cliquez sur « OK. »La covariance apparaîtra dans la zone que vous avez sélectionnée à l’étape 5.

 covariance dans excel 2013

C’est tout!

Astuce: Exécutez la fonction de corrélation dans Excel après avoir exécuté covariance dans Excel 2013. La corrélation vous donnera une valeur pour la relation. 1 est une corrélation parfaite et 0 n’est pas une corrélation. Tout ce que vous pouvez vraiment dire de la covariance, c’est s’il existe une relation positive ou négative.

Consultez notre chaîne YouTube pour plus de conseils et d’aide Excel!

Haut de page

Dodge, Y. (2008). L’Encyclopédie Concise des statistiques. Springer.
Everitt, B.S.; Skrondal, A. (2010), Le dictionnaire de statistique de Cambridge, Cambridge University Press.
Gonick, L. (1993). Le Guide de dessin animé sur les statistiques. HarperPerennial.

CITEZ CECI COMME SUIT:
Stephanie Glen. « Covariance dans les statistiques: Qu’est-ce que c’est? Exemple  » De StatisticsHowTo.com: Statistiques élémentaires pour le reste d’entre nous! https://www.statisticshowto.com/probability-and-statistics/statistics-definitions/covariance/

—————————————————————————

 Besoin d'aide pour une question de devoirs ou de test? Avec Chegg Study, vous pouvez obtenir des solutions étape par étape à vos questions d'un expert dans le domaine. Vos 30 premières minutes avec un tuteur Chegg sont gratuites!

Besoin d’aide pour une question de devoirs ou de test? Avec Chegg Study, vous pouvez obtenir des solutions étape par étape à vos questions d’un expert dans le domaine. Vos 30 premières minutes avec un tuteur Chegg sont gratuites!

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.