相関係数と危険率とは
Webサイトの改善を行うとき、
「現在の訪問数が●人で受注率が●%だから、
訪問数をこれだけ増やせば売上がこれくらい見込めます!」
なんて話もあるかと思いますが、このとき注意したいのは
訪問数と売上に正の相関関係があるのか?
という点です。
この判断基準として用いる値に相関係数と危険率があります。
相関係数とは
2種類の値から計算して求めることができる相関係数は、-1~+1の範囲で数値が出ます。
+1に近ければ近いほど「正の相関」になり、一方の数値が増えれば他方の数値も増える傾向が認められ、逆に-1に近くなると「負の相関」となり一方が増加すると他方は減少する傾向にあると言えます。
この計算式はこちらにあるように複雑なのですが、Excelを使えば簡単に求めることができます。
例えば下記のようなデータがあったとします。
このときの相関係数は以下のExcel式で求めることができます。
=CORREL(B2:B13,C2:C13)
結果は約0.91となり、+1に近いため正の相関関係にあると言えます。
危険率
相関係数を求めた結果がどんな値であろうと統計上で出た数値であり100%ということはありません。
場合によっては相関の関係から外れる数値が出ることもあり、その確率を危険率といいます。
仮に危険率が5%の場合だと、「20回に1回は相関係数とは関係のない数値が出るかもね」という具合になり、危険率が高くなればなるほど相関係数に応じた数値が出にくいということになります。
この値もExcelの計算式で求めることができ、相関係数をr、データの数をnとすると
=TDIST(r*(n-2)^0.5/(1-r^2)^0.5,n-2,2)
となります。
前述の例の場合(r=0.91、n=12)だと危険率は約0.005%(危険率が低い)ということになり、相関関係が認められる=有意であるといえます。
アクセス解析における考察
Webサイトにおいては構築段階でのシナリオがあり、シナリオ通りにユーザーが行動すれば各ポイント間に相関関係が見えてくるはずです。
つまり、測定したポイント間に相関関係が認められない場合、考えられる問題は次の2つ。
- サイト内の導線が弱い
- 来訪しているユーザーが想定していたユーザーと異なる
こんなときに訪問数だけ増やしても望んだ成果は得られないでしょう。ゴールの見直しも含め、他の改善ポイントを探してみてはいかがでしょうか?
ただ、私自身は統計学なんてかじったこともありませんので前述した内容が有意であるとはいえませんが。。。