時系列による変化からデータを比較する
第1回では「データの分析の基本は『比較』である」というお話をしました。早速今回から、様々な観点からデータを使って商品を「比較」してみましょう。今回は「時間による変化」を取り上げて考えてみたいと思います。
既存商品の月ごとの売上や、新商品の初週売上など、読者の皆さんも時系列のデータを「見る」ことは既にされているかと思います。特に食品・日用品の購買は、流行やトレンド、季節の影響を受けやすく、販売促進計画はもちろん、小売店やECへの流通・配荷の計画を立てたり修正したりするうえでも、売上のトレンドや時系列的な規則性を把握することが重要であると考えます。
「時系列分析」というと難しい解析手法が求められる印象があるかもしれませんが、本稿ではExcelでもできるような「可視化」を通してわかることを中心に議論します。プログラミングやAIを活用した、発展的な分析に関心をお持ちの方のために、こうした基本的な分析を踏まえた次のステップについて、最後にまとめていきます。
変化を比較するための様々な方法
時間による変化を、データを使って比較する方法には大きく「数表による比較」と「グラフによる比較」の2つの方法があります。どちらの方法であっても、適切に扱うことができれば意思決定をするために必要な情報をデータから最大限引き出せますが、使い方を間違えるとうまくデータを読み解けず、誤った意思決定を助長してしまう可能性もあります。
この節では、数表とグラフの適切な利用場面について、解説していきます。
数表による比較の強み
数表は、直近数年分のデータを比較する場合や、競合製品2~3品目というように、「情報が集約された結果を比較する」ような場面で用いると効果的です。たとえば、今年と昨年の〇月の売上を比較する場合、下のように数値の実績を並べることで、違いを比較することができます(図表1)。
数表の強みは「簡単な計算を通して定量的な評価ができること」にあります。図表1のように、それぞれの実績値を並べるだけでなく、違いの度合の大きさを「変化率」として計算することで、実績の変化について「大きさ」を評価することができます。
反面、ビジネス場面では、たとえば2023年と2024年の売上の変化を週単位で、それらを一気に俯瞰したい場面があります。こうした膨大な項目を数表で確認することは基本的には効率的とは言えません。たとえば以下の表をご覧ください(図表2)。
マクロミルの消費者購買履歴データ「QPR」を使い、コーヒー4ブランドの売上推移を週次で1年分抽出した数表の「一部」です。1年分のうちの4分の1の数表でも、これだけではどういう傾向があるか、読み取ることが難しいことが分かるかと思います。
こうした数表の可読性を上げる方法の1つには、表計算ソフトの標準機能である「条件付き書式」による色付けが挙げられます。以下の表は、赤セルが「高い」、青セルが「低い」ことを意味し、ある程度の変化や違いの比較のしにくさを緩和しています(図表3)。
この規模のデータであれば、条件付き書式を使うことで、ある程度は数字の高低を把握できそうです。ただし、これも書式の設定の仕方に工夫が必要ですし、データの量・複雑さが増すほど効果が薄まります。そこで効果的なのがグラフによる比較です。
グラフによる比較の強み
データの量が多く、数表では推移や違いを追いきれない場合は、グラフによる視覚表現が大いに有効です。
時系列を追いかける際に有効な可視化にはいくつかのグラフ表現がありますが、今回は「折れ線グラフ」と「縦棒グラフ」を使います。折れ線グラフと縦棒グラフはうまく組み合わせることで数表をそのまま読んだり、条件付き書式を使ったりすることと比べ、全体の傾向を効率よく、的確に掴めるようになります。
一方で、グラフによる比較は「差が大きそう」であるとか「変化が大きそう」という、視覚的な印象、すなわち「定性的な」評価にとどまります。具体的な数値としてどの程度の差が生まれていて、それが本当に大きいと言えるのかどうかは、傾向を整理し、集計を通して、数表に立ち戻ることで「定量的」に評価することが必要なこともあります。
このように、データを比較する上では、数表とグラフの強みをうまく活かしあうことが重要です。