共分散は、統計学において 2 つの変数間の線形関係を表すために使用される数値です。 2 つの変数間の共分散が大きいほど、データ ポイントの範囲にわたってそれらの値が類似する傾向があります (言い換えると、2 つの変数の曲線は互いに近くなります)。一般に、2 つの数値セット x と y の共分散は、次の式を使用して計算できます: 1/(n-1)Σ(xi- xavg ) ( yi - yavg ) 。ここで、n はサンプル サイズ、 xi は各 x ポイントの値、 xavg は x の平均値、 yi とyavg は類似しています。
ステップ パート1 パート 1/2: 標準偏差の計算式を使う 1 データを一連の (x,y) ポイントに整理します 。 分散を計算するために必要なのは、2 つの変数 x と y の値のセットだけです。グラフ上のデータ ポイントを使用する場合、データはグラフ上の一連の (x,y) 交点から取得される必要があります。あるいは、数学的手法を使用して、2 つの変数間の 1 対 1 の対応を見つける必要があります。対応する x/y データ ペアの数に注意してください。これは、分散を計算するために必要なサンプル サイズ「n」です。 たとえば、デリを経営していて、配布したクーポンが売上に影響があるかどうかを判断する必要があるとします。 x を「プロモーション日に発行されたクーポンの数」、y を「その日の売上高」と定義できます。 便宜上、上の図の表を参考にします。つまり、1 日目には x=1 枚のクーポンを発行して y=8 枚を販売し、2 日目には x=3 枚のクーポンを発行して y=6 枚を販売する、ということになります。 2 xの平均を計算します 。 x/y 値のセットを取得したら、残りの作業はほとんどありません。まず、x のすべての値を合計し、サンプル サイズで割って x の平均を計算します (平均の計算については、こちらの記事を参照してください)。この例では、上の表の「x」列の値を合計し、値の数で割る必要があります。 1+3+2+5…を計算すると、44になります。 9 で割ると 44/9 = 4.89 となり、これが x の平均値です。以下を参照してください: 1 + 3 + 2 + 5 + 8 + 7 + 12 + 2 + 4 = 44 44/9 = 4.89
3 yの平均を計算します 。 次のステップは、x の平均を計算したのと同じ方法で y の平均を計算することです。つまり、y の値を合計し、サンプル サイズで割ります。この例では、8+6+9+4...を計算して 49 を取得します。サンプルサイズで割ると、49/9 = 5.44 となり、これがyの平均です。以下を参照してください: 8 + 6 + 9 + 4 + 3 + 3 + 2 + 7 + 7 = 49 49/9 = 5.44
{"smallUrl":"https:\/\/www.wikihow.com\/images\/thumb\/1\/1b\/Calculate-Covariance-Step-4-Version-3.jpg\/v4-460px-Calculate-Covariance-Step-4-Version-3.jpg","bigUrl":"https:\/\/www.wikihow.com\/images\/thumb\/1\/1b\/Calculate-Covariance-Step-4-Version-3.jpg\/v4-728px-Calculate-Covariance-Step-4-Version-3.jpg","smallWidth":460,"smallHeight":345,"bigWidth":728,"bigHeight":546,"licensing":"<div class=\"mw-parser-output\"><\/div>"} 4計算した値を1/(n-1)Σ( xi - xavg )( yi - yavg )の式に代入します。 数式内のシグマ (Σ) 記号に注意してください。これは、各 x 値から平均を減算し、それを合計することを意味します (y についても同様です)。計算量は比較的多いので、間違いがないように細心の注意を払う必要があります。この場合、次の計算が必要です。 1/(n -1)Σ( xi - xavg )( yi - yavg ) (1/8)(((1 - 4.89)+(3 - 4.89)+(2 - 4.89)+(5 - 4.89)+(8 - 4.89)+(7 - 4.89)+(12 - 4.89)+(2 - 4.89)+(4 - 4.89))((8 - 5.44)+(6 - 5.44)+(9 - 5.44)+(4 - 5.44)+(3 - 5.44)+(3 - 5.44)+(2 - 5.44)+(7 - 5.44)) (1/8)((-0.01)((8 - 5.44)+(6 - 5.44)+(9 - 5.44)+(4 - 5.44)+(3 - 5.44)+(3 - 5.44)+(2 - 5.44)+(7 - 5.44)+(7 - 5.44)) (1/8)(-0.01)(0.04) = 0.00005
以下で説明するように、答えの0.00005 は 0 に非常に近いため、発行されたクーポンの数はデリの売上に実質的に影響を及ぼさ なかったことを意味します。 広告する パート2 パート 2/2:共分散値の使用 {"smallUrl":"https:\/\/www.wikihow.com\/images_en\/thumb\/8\/81\/Calculate-Covariance-Step-5-Version-3.jpg\/v4-460px-Calculate-Covariance-Step-5-Version-3.jpg","bigUrl":"https:\/\/www.wikihow.com\/images\/thumb\/8\/81\/Calculate-Covariance-Step-5-Version-3.jpg\/v4-728px-Calculate-Covariance-Step-5-Version-3.jpg","smallWidth":460,"smallHeight":345,"bigWidth":728,"bigHeight":546,"licensing":"<div class=\"mw-parser-output\"><\/div>"} 1共分散値が 1 の場合、完全な正の相関関係があることを意味します。 共分散値は常に1 から -1 まで の範囲になります。この範囲外の値は計算エラーを示します。結論は、共分散値が 1 または -1 にどれだけ近いかに基づいて導き出されます。たとえば、共分散値がちょうど 1 に等しい場合、2 つの変数は完全に正の相関関係にあります。つまり、一方の変数が増加すると、もう一方の変数も増加します(減少すると、もう一方の変数も減少します)。この関係は完全に線形です。つまり、変数の値がどれだけ大きいか小さいかに関係なく、2 つの変数間の関係は同じです。たとえば、レモネードを販売するという単純なビジネスを考えてみましょう。レモネード1杯の値段は3元です。 x が販売されたレモネードのグラス数を表し、y が収益を表す場合、x が増加すると y も常に増加します。以下を参照してください: レモネードを10杯売る:x = 10、y = ¥30 レモネードを100杯販売する:x = 100、y = ¥300 レモネード100万杯を販売: x = 1,000,000、y = ¥3,000,000 x の値がどれだけ大きくても、y は常に 3(x) に等しくなります。したがって、 x と y は完全に正の相関関係にある 、つまり相関係数は 1 であると言えます。
2共分散値が -1 の場合、完全な負の相関関係を意味します。 一方、共分散値が -1 の場合、2 つの変数は完全に負の相関関係にあります。 [1] つまり、一方の変数が増加すると、もう一方の変数が減少し、その逆も同様です。上記のように、この関係も線形です。 2 つの変数が分離する比率は時間の経過とともに変化しません。たとえば、合計 10,000 バレルの石油を生産する油井を管理しているとします。 x が掘削されたバレルの数に等しく、y がまだ井戸の中にあるバレルの数に等しい場合、x が増加するたびに y は減少します。つまり、掘削された石油が再び油井に戻ることは絶対にあり得ないのです。 [2] 以下を参照してください: 1バレルの石油を掘削する: x = 1、y = 9,999 2,000 バレルの石油が掘削されました: x = 2,000、y = 8,000。 10,000 バレルの石油が掘削されました: x = 10,000、y = 0。 x が増加する限り、y は同じ割合で減少します。この関係は直線的であり、掘削される石油 1 バレルごとに、地中の石油が 1 バレル減ることを意味します。したがって、 x と y は完全に負の相関関係にある 、つまり相関係数は -1 であると言えます。
{"smallUrl":"https:\/\/www.wikihow.com\/images_en\/thumb\/c\/cd\/Calculate-Covariance-Step-7-Version-2.jpg\/v4-460px-Calculate-Covariance-Step-7-Version-2.jpg","bigUrl":"https:\/\/www.wikihow.com\/images\/thumb\/c\/cd\/Calculate-Covariance-Step-7-Version-2.jpg\/v4-728px-Calculate-Covariance-Step-7-Version-2.jpg","smallWidth":460,"smallHeight":345,"bigWidth":728,"bigHeight":546,"licensing":"<div class=\"mw-parser-output\"><\/div>"} 3.共分散が 0 の場合、相関がないことを意味することに注意してください。 共分散が 0 の場合、2 つの変数は無関係であることを意味します。 [3] 言い換えれば、ある変数の増加または減少が他の変数の増加または減少につながるとは予測しません。 2 つの変数の間には線形関係はありませんが、非線形関係が存在する可能性があります。たとえば、ある人がウイルス性疾患に対してホメオパシー治療を受けているとします。 x が薬の投与量(ティースプーンで測定)で、y が患者の血流中のウイルス量(ミリリットルあたりの国際単位(IU/mL)で測定)である場合、x が増加すると y が増加するか減少するかを予測することはできません。 yの変動はxとは完全に独立している[4] 。以下を参照してください: 小さじ1杯を摂取する場合: x = 1、y = 615。 小さじ10杯の摂取:x = 10 y = 700。 小さじ20杯の摂取:x = 20、y = 455。 x が増加すると、y が増加するか減少するかを予測することは不可能です。両者の関係は不明で、薬を多く服用するとウイルス量が減ることもありますが、ウイルス量が増加することもあります。したがって、 x と yはほとんど無関係である と想定できます。
{"smallUrl":"https:\/\/www.wikihow.com\/images_en\/thumb\/a\/af\/Calculate-Covariance-Step-8.jpg\/v4-460px-Calculate-Covariance-Step-8.jpg","bigUrl":"https:\/\/www.wikihow.com\/images\/thumb\/a\/af\/Calculate-Covariance-Step-8.jpg\/v4-728px-Calculate-Covariance-Step-8.jpg","smallWidth":460,"smallHeight":345,"bigWidth":728,"bigHeight":546,"licensing":"<div class=\"mw-parser-output\"><\/div>"} 4-1 から 1 の間の値は不完全な相関を意味することに注意してください。 ほとんどの共分散値は厳密には 1、-1、または 0 に等しくなく、通常はその間のどこかにあります。共分散値が特定のベンチマーク値にどれだけ近いかに応じて、正の相関があるか、負の相関があるかを判断できます。たとえば、共分散値が 0.8 の場合、完全な相関ではありませんが、強い正の相関があることを意味します。つまり、x が増加すると y も一般的に増加し、x が減少すると y も一般的に減少しますが、この関係は完全に安定しているわけではありません。 広告するヒント 散布図に関する記事と相関係数の計算に関する記事を読むことで、関連情報を得ることができます。 共分散方程式は株式を比較するためによく使用されます。投資家は 2 つの株式が互いに連動して動くかどうかを知りたいのです。この質問に答えるには、以下に示すように、一定期間にわたる 2 つの株式の日々のパフォーマンスを比較する表だけが必要です。 会社A (x): (1.6 + 1.9 + 2.1 + 3.2 + 0.5 + 0.4 + 0.6)/7 = 1.47 会社B(y):(2.0 + 2.4 + 2.6 + 3.6 + 0.9 + 0.8 + 1.0)/ 7 = 1.9 (1/n-1)(Σ( xi - xavg )( yi - yavg ) (1/6)(((1.6 - 1.47)+(1.9 - 1.47)+(2.1 - 1.47)+(3.2 - 1.47)+(0.5 - 1.47)+(0.4 - 1.47)+(0.6 - 1.47))((2.0 - 1.78)+(2.4 - 1.78)+(2.6 - 1.78)+(3.6 - 1.78)+(0.9 - 1.78)+(0.8 - 1.78)+(1.0 - 1.78)) (1/6)((0.01)(0.84)) (1/6)(0.084) = 0.14 .
広告する