SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

おすすめのイベント

おすすめの講座

おすすめのウェビナー

マーケティングは“経営ごと” に。業界キーパーソンへの独自取材、注目テーマやトレンドを解説する特集など、オリジナルの最新マーケティング情報を毎月お届け。

『MarkeZine』(雑誌)

第107号(2024年11月号)
特集「進むAI活用、その影響とは?」

MarkeZineプレミアム for チーム/チーム プラス 加入の方は、誌面がウェブでも読めます

実践!WebマーケターのためのR入門

Rのパワーアップキットを使ってイケてるグラフをサクッと作成しよう【R入門講座】


 この連載ではフリーの統計解析言語かつ統計解析ソフトウェアである「R」についてマーケター向けにわかりやすく解説していきます。今回は相関分析/散布図の可視化を中心にRの強力なグラフィックス機能を体験してみましょう!後半ではベイジアンネットワーク!についても簡単に紹介します。

ド・ノーマルからモデルチェンジ!

 突然ですができるビジネスマン風に見える人ってかっこよくてでわかり易いグラフをさらっと資料に忍ばせていると思いませんか?

 Rのパワーアップキットをインストールすることで、そんなステキなグラフがサクっと作れるようになってしまいます。素っ気ないコンソール画面をワクワク楽しんでもらえるようになって頂けたら本望です。

 Rをインストールしたそのまま状態は、ガンダムで例えるとド・ノーマルな状態なんです。つまりビームサーベルとバルカン状態。アムロはビームライフル、シールド、ガンダムハンマー、ハイパーバズーカ、ビームジャベリンといった武器を使い分けていました。他にはGファイターなんてのもありましたね。

 インストールしたド・ノーマルのRも必要に応じて「パッケージ」と呼ばれる言わばパワーアップキットを追加することで多彩なグラフの描写や、分析手法の幅を広げることが可能となるのです!

 では早速、パワーアップキット(パッケージ)のインストールと参りましょう。手順としては、1.ダウンロードサイトの選択、2.ダウンロードするパッケージの選択が必要となります。

 Rを起動しメニューから「パッケージ」→「CRANミラーサイト」を選択します。

 ダウンロード先のミラーサイトを選択します。ここでは、「Japan(Tokyo)」選んでみましょう。

 続いて、「パッケージ」→「パッケージのインストール」を選びます。するとパッケージ一覧が表示されます。膨大な量がありますが、今回は以下の5つのパッケージを選びましょう。ちなみに、ウィンドウズの基本操作であるCtrlキー+マウス左クリックで複数項目の選択も可能です。

  • car:回帰分析の応用(この中の散布図行列を利用します)
  • deal:ベイジアンネットワーク(今回の最後に使います)
  • ggplot2:かっこいいグラフ描画
  • gridExtra:かっこいいグラフ描画
  • psych:心理統計手法(この中の相関係数行列を利用します)

 選択が終了したら「OK」ボタンをクリックするとインストールが開始されます。無事インストールが済んだらこれらのパッケージを使うぞ!とRに宣言して教えてあげましょう。

  • library(car)
  • library(deal)
  • library(ggplot2)
  • library(gridExtra)
  • library(psych)

 これで、5つのパッケージが使えるようになりました!さて何はともあれ、いつものデータの読み込みから。

sample<-read.table("c:/data/sample.txt",header=T)

 次に相関分析に入っていきたいと思います。

cor(sample$純広告,sample$CV_純広告,method="pearson")

 相関係数は2つの間の関係の強さを測る指標です。同じ方向に動くようであればプラスに、逆方向に動くようであればマイナスとなります。また、ピアソンの積率相関係数はその定義から-1から+1の値を取ります。

 ココでは0.086ですので弱い相関があるようですね。

【注】いくつ以上であれば強い相関、いくつであれば弱い相関がある、とも説明されますが業種や扱っているデータによって異なるので絶対的な基準はないと考えます(株式のデータ分析においては、将来の収益率を予測しようとする際に相関係数が0.1あれば、なかなか高いな…となるケースもしばしばありました)。

 相関係数は実は1つではありません。Rのcor関数では3種類の相関係数の出力が可能です。method=の後をそれぞれ下記のように変更し対応できます。

  • "pearson":ピアソンの積率相関係数
  • "kendall":ケンドールの順位相関係数
  • "spearman":スピアマンの順位相関係数

【注】通常の量的尺度と呼ばれる数値データを扱う場合には、ピアソンの積率相関係数が使われます。順序が一致しているかどうか?の相関を知りたい場合はケンドールもしくはスピアマンの順位相関を使います

簡単! 2015年2月10日「3つ」覚えて分析から視覚化まで即実践!Rでできるデータ分析講座開催

Rをインストールしたが、無骨なUIに「今日はこのへんで……」と、そっと閉じてしまった方にオススメです!

本講座では実機を使って「できるだけわかりやすく」グラフ化&データ分析をワークショップ形式で簡単に身に付けることができます。

★☆★「Rでできるデータ分析講座」の詳細・お申し込みはこちら★☆★

会員登録無料すると、続きをお読みいただけます

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

次のページ
早速、散布図を作成しよう

この記事は参考になりましたか?

  • Facebook
  • X
  • Pocket
  • note
関連リンク
実践!WebマーケターのためのR入門連載記事一覧

もっと読む

この記事の著者

豊澤 栄治(トヨサワ エイジ)

株式会社ファンコミュニケーションズ サービス開発部 情報科学技術研究所 所長

横浜国立大学経営学部、一橋大学大学院国際企業戦略研究科卒

SPSS Japan、みずほ第一フィナンシャルテクノロジー(株)、外資系運用会社(Amundi Japan)での経験を活かし、金融の分析ノウハウをマーケティ...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

MarkeZine(マーケジン)
2015/04/21 12:06 https://markezine.jp/article/detail/20541

Special Contents

PR

Job Board

PR

おすすめ

イベント

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング