ド・ノーマルからモデルチェンジ!
突然ですができるビジネスマン風に見える人ってかっこよくてでわかり易いグラフをさらっと資料に忍ばせていると思いませんか?
Rのパワーアップキットをインストールすることで、そんなステキなグラフがサクっと作れるようになってしまいます。素っ気ないコンソール画面をワクワク楽しんでもらえるようになって頂けたら本望です。
Rをインストールしたそのまま状態は、ガンダムで例えるとド・ノーマルな状態なんです。つまりビームサーベルとバルカン状態。アムロはビームライフル、シールド、ガンダムハンマー、ハイパーバズーカ、ビームジャベリンといった武器を使い分けていました。他にはGファイターなんてのもありましたね。
インストールしたド・ノーマルのRも必要に応じて「パッケージ」と呼ばれる言わばパワーアップキットを追加することで多彩なグラフの描写や、分析手法の幅を広げることが可能となるのです!
では早速、パワーアップキット(パッケージ)のインストールと参りましょう。手順としては、1.ダウンロードサイトの選択、2.ダウンロードするパッケージの選択が必要となります。
Rを起動しメニューから「パッケージ」→「CRANミラーサイト」を選択します。
ダウンロード先のミラーサイトを選択します。ここでは、「Japan(Tokyo)」選んでみましょう。
続いて、「パッケージ」→「パッケージのインストール」を選びます。するとパッケージ一覧が表示されます。膨大な量がありますが、今回は以下の5つのパッケージを選びましょう。ちなみに、ウィンドウズの基本操作であるCtrlキー+マウス左クリックで複数項目の選択も可能です。
- car:回帰分析の応用(この中の散布図行列を利用します)
- deal:ベイジアンネットワーク(今回の最後に使います)
- ggplot2:かっこいいグラフ描画
- gridExtra:かっこいいグラフ描画
- psych:心理統計手法(この中の相関係数行列を利用します)
選択が終了したら「OK」ボタンをクリックするとインストールが開始されます。無事インストールが済んだらこれらのパッケージを使うぞ!とRに宣言して教えてあげましょう。
- library(car)
- library(deal)
- library(ggplot2)
- library(gridExtra)
- library(psych)
これで、5つのパッケージが使えるようになりました!さて何はともあれ、いつものデータの読み込みから。
sample<-read.table("c:/data/sample.txt",header=T)
次に相関分析に入っていきたいと思います。
cor(sample$純広告,sample$CV_純広告,method="pearson")
相関係数は2つの間の関係の強さを測る指標です。同じ方向に動くようであればプラスに、逆方向に動くようであればマイナスとなります。また、ピアソンの積率相関係数はその定義から-1から+1の値を取ります。
ココでは0.086ですので弱い相関があるようですね。
【注】いくつ以上であれば強い相関、いくつであれば弱い相関がある、とも説明されますが業種や扱っているデータによって異なるので絶対的な基準はないと考えます(株式のデータ分析においては、将来の収益率を予測しようとする際に相関係数が0.1あれば、なかなか高いな…となるケースもしばしばありました)。
相関係数は実は1つではありません。Rのcor関数では3種類の相関係数の出力が可能です。method=の後をそれぞれ下記のように変更し対応できます。
- "pearson":ピアソンの積率相関係数
- "kendall":ケンドールの順位相関係数
- "spearman":スピアマンの順位相関係数
【注】通常の量的尺度と呼ばれる数値データを扱う場合には、ピアソンの積率相関係数が使われます。順序が一致しているかどうか?の相関を知りたい場合はケンドールもしくはスピアマンの順位相関を使います
簡単! 2015年2月10日「3つ」覚えて分析から視覚化まで即実践!Rでできるデータ分析講座開催
Rをインストールしたが、無骨なUIに「今日はこのへんで……」と、そっと閉じてしまった方にオススメです!
本講座では実機を使って「できるだけわかりやすく」グラフ化&データ分析をワークショップ形式で簡単に身に付けることができます。