時系列データの取り扱いとは?
さてさて、第3回目となりました本連載。徐々に突っ込んでカコヨスかつ実践的な内容を盛り込んでいきたいと思います。
脱線ばかりしていると編集長にばっさり削除されてしますので、、、前置きはこれくらいにして早速始めましょう!
今回のテーマは時系列データの取り扱いです。
ん? 時系列データってなんぞや? いやいや、恐れることはありません!
過去の2回で使っていたデータも時系列データです。日付順に純広告のインプレッションやCVなどが並んでいましたね。もちろん、日次でなくとも月次や四半期ごとに集計されて時間順に並んでいるのであれば時系列データです。
時系列データを扱う際のポイントは使っているデータがきちんと揃っていることです。
具体的には2014年1月1日のデータがあったとして、純広告のインプレッションはきちんと揃っているものの、純広告のCVは午後のデータしかありませんでした!
とか言うのはダメです。ダメ絶対。
できる限りきちんとしたデータを集めましょう。時系列分析を活用するとデータを分解することができます。
ん、データの分解?
例えば、ある売上高のデータ系列が2014/1/1~2014/6/30まで日別であったとしましょう。この時期にあった大きなイベントは…? そうです! 消費増税ですね。
買い置きができる商品であれば、3月に「一時的」な売り上げの増加があったかもしれません。また、平日よりも週末が売れる傾向がある商品かもしれません。
時系列分析のある手法を使うと、データを次の3つに分解できるのです!
- 一時的なノイズ
- 曜日などの周期的な動き
- トレンド
これは今回の最後で紹介しますね。では早速、いつものデータを読み込みます。
sample<-read.table("c:/data/sample.txt",header=T)
これまでは「ファイル」→「ディレクトリの変更」で読み込みファイルのフォルダを指定していましたが、上記のようにファイルのパスを全て記入することもできます。
第1回で確認したように純広告、インプレッション、CV_純広告、CV_インプレッションの4系列は規則的な上下の振幅が確認できました。
この規則的な振幅について確認していきましょう。
簡単! 2015年2月10日「3つ」覚えて分析から視覚化まで即実践!Rでできるデータ分析講座開催
Rをインストールしたが、無骨なUIに「今日はこのへんで……」と、そっと閉じてしまった方にオススメです!
本講座では実機を使って「できるだけわかりやすく」グラフ化&データ分析をワークショップ形式で簡単に身に付けることができます。