新規
会員登録

実践！WebマーケターのためのR入門

Rで本格的に分析を始める前に「必ず」確認しておきたいこと【R入門講座】

豊澤栄治[著]

更新日: 2015/04/21
公開日: 2014/06/10

通知

　2回目となる今回は分析を始める前に確認しておきたい「平均値」「中央値」「最大値」「最小値」といった基本統計量と呼ばれる値や、手元にあるデータの特徴を簡単に確認できる「ヒストグラム」について解説していきます！

通知

本格的な分析を始める前に「必ず」確認しておきたいこと

　さて！第二回目は、本格的に分析を始める前に「必ず」確認しておきたいことを紹介していきます。

　散々苦労して分析を終えて考察も書き終えて、ホッとしてると………

　ある記憶がふとよみがえります！

　「（ぁ！）………。」

　「この期間は、元のデータが100倍の数値が入っているので差し替えが必要なんだーー！」

　迫る終電、止まる空調、手に汗握る……今晩もタクシー自腹か…。嫌な記憶がよみがえります。こんな状況は「絶対」に避けたいですよね。私も絶対に嫌です。

　しかし直前に、アレコレと焦ってはミスがミスを誘発してしまいます。そこでパッと、データに異常値がないか推測できたら嬉しいと思いませんか？

　できます！　できるのです！

　「平均値」「中央値」「最大値」「最小値」といった基本統計量と呼ばれる値や、手元にあるデータの特徴を簡単に確認できる「ヒストグラム」にチャレンジしていきましょう。

用語の簡潔な説明

平均値：「全データを合計」して「データの数」で割った値。ちなみにExcelの関数ではaverage()
中央値：「全データを小さい順番に並べてちょうど真ん中の値」。こちらExcelではmedian()
最大値：「全データ中で最も大きな値」Excelではmax()
最小値：「全データ中で最も小さな値」Excelではmin()

　という訳で、前回の「Rの起動と準備」を参考にデータを読み込みましょう。

善は急げ！　早速、平均値を計算

　早速、純広告のインプレッションの平均値を計算します。

　mean(sample[,2:2])

　と打ち込んでみましょう。

　と表示されますね。ここで、

　sample[,2:2]

　は、2列目の変数の値全てを選択するという意味でした。続いて、

　mean(sample[,3:3])

　mean(sample[,4:4])

　mean(sample[,5:5])

　と、コピペして下さい。

　となります。ちなみに変数指定のやり方ですが、

　mean(sample[,"純広告"])

　mean(sample[,"リスティング"])

　mean(sample[,"CV_純広告"])

　mean(sample[,"CV_リスティング"])

　や、

　mean(sample[,'純広告'])

　mean(sample[,'リスティング'])

　mean(sample[,'CV_純広告'])

　mean(sample[,'CV_リスティング'])

　と、変数名をシングルクォーテションやダブルクォーテーションで囲んでもOKです。

　補足ですがWordにはシングルクォーテションやダブルクォーテーションを自動的に全角にしてしまう可能性があります。Word2010ではファイル→オプション→文書校正→オートコレクトのオプション→’’を‘ ’に変更するのチェックを外すと解消されるようです）

　と、ここまできて、

　ん……………。確かに平均値は計算できてるが「全然便利に感じない」。というか、列選択とかメンドイし、そろそろコンソールを閉じたい、、、ですよね。閉じる前にコレを入力してみましょう！

　summary(sample[,2:5])

　何やらまとめて一気に表示されました。Minは最小値、Meanは平均値、Maxは最大値であることは想像できます。では1st Qu、Median、3rd Quは？？？　意味がわかりませんね。

簡単！ 2015年2月10日「3つ」覚えて分析から視覚化まで即実践！Rでできるデータ分析講座開催

Rをインストールしたが、無骨なUIに「今日はこのへんで……」と、そっと閉じてしまった方にオススメです！

本講座では実機を使って「できるだけわかりやすく」グラフ化＆データ分析をワークショップ形式で簡単に身に付けることができます。

★☆★「Rでできるデータ分析講座」の詳細・お申し込みはこちら★☆★

会員登録無料すると、続きをお読みいただけます

新規会員登録無料のご案内

・全ての過去記事が閲覧できます
※プレミアム記事（有料）は除く
・会員限定メルマガを受信できます

メールバックナンバー

新規会員登録無料

次のページ
なぜ統計量を確認する必要があるのか

この記事は参考になりましたか？

関連リンク: マーケティングメトリックス研究所
実践！WebマーケターのためのR入門連載記事一覧: Rでできるデータの前処理、ユーザーIDをキーにして2つのデータを連結しよう【R入門講座・番...

最終回／ダミー変数を使って上手にデータをまとめ、グループごとの特徴を把握しよう【R入門講座...

顧客属性データとコンバージョンデータを使ってどんどん打ち手を考えよう！【R入門講座】

もっと読む

この記事の著者: 豊澤栄治（トヨサワエイジ）

株式会社ファンコミュニケーションズサービス開発部情報科学技術研究所　所長
横浜国立大学経営学部、一橋大学大学院国際企業戦略研究科卒
SPSS Japan、みずほ第一フィナンシャルテクノロジー（株）、外資系運用会社(Amundi Japan)での経験を活かし、金融の分析ノウハウをマーケティ...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この著者の最近の執筆記事

この記事は参考になりましたか？

この記事をシェア

通知

Special Contents

PR

Job Board

PR

おすすめ

イベント

新規会員登録無料のご案内

・全ての過去記事が閲覧できます
・会員限定メルマガを受信できます

メールバックナンバー

新規会員登録無料

アクセスランキング

アクセスランキング