SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

おすすめのイベント

  • MarkeZine Day 2020 Autumn Kansai

おすすめの講座

  • [11月12日]Googleアナリティクス実践講座~基本操作編

おすすめのウェビナー

  • MarkeZine Day 2020 Autumn Kansai

マーケティングは“経営ごと” に。業界キーパーソンへの独自取材、注目テーマやトレンドを解説する特集など、オリジナルの最新マーケティング情報を毎月お届け。

定期誌「MarkeZine」

第62号(2021年2月号)
特集「D2Cビジネス成功の法則」

定期誌購読者なら
誌面がウェブでも読めます

実践!WebマーケターのためのR入門

顧客属性データとコンバージョンデータを使ってどんどん打ち手を考えよう!【R入門講座】

 5回目となる今回は顧客属性データとコンバージョンデータをサンプルとして取り上げます。どんどん打ち手が考えられるよう、効率よくデータを使っていきましょう。

チャチャっと状況確認して次の打ち手を考える

 顧客属性データとコンバージョンデータは企業内によく「あるある」データの形式かと思います。こういったデータが手元にある際に、チャチャっと状況を確認して次の打ち手を考えたい! そんなニーズにお応えしていきましょう!

 クロス集計表、モザイク図、決定木といった手法を活用していきますが、あくまで手法は目的達成のための手段でしかありません。正しく使って効率化し考える時間を捻出しましょう。

 前回解説しましたパワーアップキットこと「パッケージ」についても使っていきます。「パッケージ」の追加設定方法については必要に応じて前回記事をご参考にして下さい!

今回使用するパッケージ一覧
  • vcd
  • ggplot2
  • rpart
  • rpart.plot

 早速、こちらのサンプルデータをダウンロードしてRに読み込みましょう。

sample<-read.csv("c:/data/CV_data.csv",header=T)

 元のデータはこのようになっています。

 Rで確認してみましょう。

head(sample)

サンプルデータの意味
  • ID:ユーザーID
  • CV:コンバージョンした/していない(yes/no)
  • AGE:年齢
  • SEX:男性/女性(Male/Female)
  • AD:接触した広告(DSP/Mail/Listing)

 “販売サイトでのユーザー毎の購入データ”や、“マンションなどの資料請求サイト”などをイメージして頂くとよいでしょう。

 ポイントは、1ユーザーデータ=1行 という関係です。複数行ではありません。今回の分析においてコレ重要です。

 あれ!? なんで今回は日本語の変数名ではないのか? とツッコミが入りそうですね。

 そうなんです。vcdパッケージを使うのですが日本語表示で問題がありまして、英語表記とさせて頂きます。環境によってはうまいこといくかも知れませんが……。お許しください!

 何はともあれ集計して中身を確認しましょう。

 これまでも取り上げた下記コマンドを入力。

summary(sample)

  • IDは10から始まって最大値は59
  • CVしているユーザー数(yes)は35。CVしていないユーザー数(no)は15。
  • 年齢は20から50歳までで分布。中央値35歳>平均値33.38歳なので若い人が外れ値となって平均値を押し下げてるのかも。
  • 男女比率はほぼ半々。
  • 接触広告はMail>Listing>DSPの順で多い。

 といったことがわかりましたね。

データの種類について学びましょう!

 さて、ユーザーIDですが数値データですよね? でもってこの数値の大小に意味があるか無いかというと……

 ユーザーIDが大きいから役職が上とか、お客様として偉い!とか、なんて事は……ありませんね(番号が若い方がデータベース登録日が古い、ということはあるかもしれません)。

 また、ユーザーIDの引き算や割り算といった四則演算に意味がないこともご理解頂けるのではないでしょうか?

 つまりこの数値は単なるラベルなんですよね。このような変数のことを「質的変数」「カテゴリカルデータ」なんて言ったりします。

 他の変数はどうでしょうか?

 CVは「yes」か「no」か(小田和正さん?嵐?世代が……)。性別は男性か女性か、広告はDSPかメルマガかリスティングか…。何れも分類しているだけで大小の区別はありません。という訳でこれらも「質的変数」ってことになります。

 一方で、年齢はどうでしょうか?

 こちらは数字で表現されていて大小に意味がありますね。さっきは"質"的変数でしたので対義語は…量!と言うことで「量的変数」と呼びます。

簡単! 2015年2月10日「3つ」覚えて分析から視覚化まで即実践!Rでできるデータ分析講座開催

Rをインストールしたが、無骨なUIに「今日はこのへんで……」と、そっと閉じてしまった方にオススメです!

本講座では実機を使って「できるだけわかりやすく」グラフ化&データ分析をワークショップ形式で簡単に身に付けることができます。

★☆★「Rでできるデータ分析講座」の詳細・お申し込みはこちら★☆★

会員登録無料すると、続きをお読みいただけます

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

次のページ
何はともあれクロス集計!

この記事は参考になりましたか?

  • Facebook
  • Twitter
  • Pocket
  • note
実践!WebマーケターのためのR入門連載記事一覧

もっと読む

関連リンク
この記事の著者

豊澤 栄治(トヨサワ エイジ)

株式会社ファンコミュニケーションズ サービス開発部 情報科学技術研究所 所長横浜国立大学経営学部、一橋大学大学院国際企業戦略研究科卒SPSS Japan、みずほ第一フィナンシャルテクノロジー(株)、外資系運用会社(Amundi Japan)での経験を活かし、金融の分析ノウハウをマーケティング分野に適...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

Special Contents

PR

Job Board

PR

おすすめ

イベント

    • MarkeZine Day 2020 Autumn Kansai
    • MarkeZine Day 2020 Autumn Kansai
    • MarkeZine Day 2020 Autumn Kansai

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング