目次(クリックするとそのセクションにスキップします):
- 定義&式
- 例
- 解釈の問題
- 利点
- Excelでの共分散
定義&式
共分散は、二つの確率変数がどれだけ一緒に変化するかの尺度です。 これは分散に似ていますが、分散が単一の変数がどのように変化するかを示す場合、co分散は2つの変数がどのように一緒に変化するかを示します。
ウィスコンシン州のUからの画像。
共分散式
ビデオを見て例を見てください:
ビデオを見ることができませんか? ここをクリックしてください。式は次のとおりです。
Cov(X,Y)=√E((X–∞)E(Y–∞))/n-1ここで、:
- Xは確率変数
- E(X)=λは確率変数Xの期待値(平均)、
- E(Y)=λは確率変数Yの期待値(平均)
- n=データセット内の項目数です。
- Σ和の表記。
トップに戻る
例
次のデータセットの共分散を計算します。
x:2.1,2.5,3.6,4.0(mean=3.1)
y:8,10,12,14(mean=11)
値を式に代入して解きます。
cov(x,y)=λ e((x-λ)(y-λ))/n-1
= (2.1-3.1)(8-11)+(2.5-3.1)(10-11)+(3.6-3.1)(12-11)+(4.0-3.1)(14-11) /(4-1)
= (-1)(-3) + (-0.6)(-1)+(.5)(1)+(0.9)(3) / 3
= 3 + 0.6 + .5 + 2.7 / 3
= 6.8/3
= 2.267
結果は肯定的であり、変数が肯定的に関連していることを意味します。
nまたはn-1で割ることに関する注意:
サンプルを扱うとき、変化する自由度を持つn-1項があります(自由度を参照)。 あなただけの2つの確率変数の共分散を見つけている場合は、単にnで除算します。
トップに戻る
解釈に関する問題
大きな共分散は、変数間の強い関係を意味する可能性があります。 ただし、異なるスケール(ポンドやインチなど)を持つデータセットの分散を比較することはできません。 あるデータセット内の弱い共分散は、異なるスケールを持つ異なるデータセット内の強い共分散である可能性があります。
解釈の主な問題は、それが取る結果の広い範囲は、解釈することが困難になるということです。 たとえば、データセットが3、つまり3,000の値を返す可能性があります。 この広い範囲の値は、単純な事実によって引き起こされます; XとYの値が大きいほど、共分散は大きくなります。 300の値は、変数が相関していることを示していますが、相関係数とは異なり、その数はその関係がどれほど強いかを正確に教えてくれません。 この問題は、共分散を標準偏差で除算して相関係数を取得することで解決できます。
Corr(X,Y)=Cov(x,Y)/θ x θ y
トップに戻る
相関係数の利点
相関係数は、関係の強さを決定するための共分散よりもいくつかの利点があります:
- 共分散は、相関が制限されている間、実質的に任意の数を取ることができます:-1から+1。
- 数値的な制限があるため、相関関係は2つの変数の間の関係の強さを決定するのにより便利です。
- 相関には単位がありません。 共分散には常に単位があります
- 相関は中心の変化の影響を受けません(つまり、 平均)または変数のスケール
トップに戻る
Excelで共分散を計算
ビデオを見るか、以下の手順に従ってください(これはExcel2013の場合ですが、手順はExcel2016):
Excelでの共分散:概要
共分散は、変数が正の関係にある場合に正の数を与えます。 それらが否定的に関連している場合は、負の数を取得します。 共分散が高いと、基本的には変数間に強い関係があることを示します。 低い値は、弱い関係があることを意味します。 Excelでの共分散:ステップ
ステップ1:Excelの2つの列にデータを入力します。 たとえば、列AにX値を入力し、列BにY値を入力します。
ステップ2:[データ]タブをクリックし、[データ分析]をクリックします。「データ分析ウィンドウが開きます。ステップ3:「共分散」を選択し、「OK」をクリックします。ステップ4:「入力範囲」をクリックし、すべてのデータを選択します。 列ヘッダーがある場合は、列ヘッダーを含めます。
ステップ5:データ選択に列ヘッダーを含めている場合は、”最初の行のラベル”チェックボックスをクリックします。
ステップ6:”出力範囲”を選択し、ワークシート上の領域を選択します。 選択するのに適した場所は、データセットの右側にある領域です。ステップ7:「OK」をクリックします。”共分散は、ステップ5で選択した領域に表示されます。
これで終わりです!
ヒント:Excel2013で共分散を実行した後、Excelで相関関数を実行します。 相関関係はあなたに関係の価値を与えます。 1は完全な相関であり、0は相関なしです。 共分散から本当にわかるのは、正または負の関係があるかどうかだけです。
詳細については、YouTubeチャンネルをチェックしてくださいExcelのヒントとヘルプ!
トップに戻る
Dodge,Y.(2008). 統計の簡潔な百科事典。 スプリンガー
Everitt,B.S.;Skrondal,A.(2010),The Cambridge Dictionary of Statistics,Cambridge University Press.
Gonick,L.(1993). 統計への漫画ガイド。 ハーパーパーペナル…
Stephanie Glen。 “統計における共分散:それは何ですか? 例”からStatisticsHowTo.com: 私たちの残りのための基本的な統計! https://www.statisticshowto.com/probability-and-statistics/statistics-definitions/covariance/
—————————————————————————
宿題やテストの質問の助けが必要ですか? Cheggの調査を使うと、分野の専門家からのあなたの質問に段階的な解決を得ることができます。 Cheggの家庭教師とのあなたの最初の30分は無料です!