検索ボリュームから売上枚数を予測する!?
さて私見ではありますが、「恋するフォーチュンクッキー」は、単なるノリのよいダンスナンバーではなく、クチコミ動画などを通じて、世代を超えたダンスナンバーとして認知されるにいたったと言えます。そこでここからは、
・AKB48がバズっている
・楽曲の認知
の関係について分析していきたいと思います。
まず、「バズっているかどうか?」の代理変数として「AKB48の検索ボリューム」を使います。さらに「楽曲の認知/浸透度」の代理変数として「売上枚数」を使用してみましょう。代理変数というのは、直接計測することができない量の代わりになる変数のことです。AKB48について日本国民全員でどれだけ話題にされているかを直接計測することは難しいでしょう。一人ひとりに聞いていては今のメンバー全員卒業してしまいます!!!
私が立てた仮説は次のようになります。
【仮説】「AKB48のイベントが世間の注目を大きく集める」には以下の事象が重要になる。
・ネットで調べる人が増える
・検索ボリュームが増える
・曲を気に入って買う人が増える
・その後のシングルの売上枚数が増加する
では、実際に検証していきましょう。
さっそく分析してみたが……
ということで、まず散布図を作ってみました。これは累計売上枚数を縦軸に、シングル発売週ごとの「AKB48」というキーワードの検索ボリュームを横軸にとっています。

ここから、発売週の検索ボリュームで累計売上枚数を予測する大胆なモデルを構築してみました。
y = 21,699x + 457,601
R2 = 0.4579
このモデルの意味するところは、
累計売上枚数 = 21,699 × 検索ボリューム + 457,601
ということになります(係数のp値はいずれも5%有意)。
この数式について少し説明すると、「21,699」というのは、AKB48の検索ボリュームが1増加すると累計売上枚数は21,669枚増加するという意味で、グラフ内の直線の傾きで表されています。これは回帰係数と呼ばれます。「457,601」は、仮にAKB48の検索ボリュームが0だったとしたら、457,601枚売れることを意味します。グラフ内の直線が累計売上枚数の軸と交わるところで表されます。これは切片と言います。
しかし、モデルを構築しても、21,669と47,601が意味のない値であっては、役に立たないですよね? ですので、意味があるかどうかを統計的にチェックする必要があります。回帰係数や切片が「0」の確率が5%以下である場合、「有意水準5%で有意」なんて言ったりします。
「R2」は、モデルの当てはまりの程度を測る指標です。1に近いほど当てはまりの程度が良いと言えます。これは決定係数あるいは重相関係数と言います。
はい、ではあらためて上の図を見てみましょう。直線より上にある楽曲は予測モデルの想定よりも売れた曲です。直線より下の楽曲は予測モデルの想定よりも売れなかった曲になります。我らがフォーチュンクッキーは想定よりも売れていますね!
でもなんと言いますか……、なんか面白味のない結果です。いまひとつ実感がわかない。
なぜ面白味がないと感じたのか。ヘビロテやポニシュシュが、実感している認知/浸透度の割に、想定より売れなかったということになってしまっているからです。これは何か違うと感じるわけです。
なんでやねん??
というわけで、この違和感を解消するべくモデルを見直すことにしました。
その先の出口へ
分析の視点を変える必要性がある。そう感じた私は、AKB48のシングルCDといえば、誰しも思い浮かべるあるものに注目しました。
そうです。「握手券」です。
これを目当てで購入している一部ファン層の影響が大き過ぎるんじゃね?と、疑問をお持ちのあなた。私もそう思います。一部のファンが大量にCDを買いまくっても、日本全体に楽曲の認知度は広がってはいきません……。ということで、少しでも握手会の影響を緩和できないかを考えてみました。
●熱心なファンの方は発売後1週間以内に購入するのでは?
⇒ってことは、累計売上枚数から初動売上枚数を引けば、熱心なファン以外がどれだけ購入したかわかるのでは?
⇒そんでもって長いことブームになっていれば一般の人も買って浸透してるのでは?
というわけで、方針変更です。縦軸を「累計売上枚数」から「累計売上枚数―初動売上枚数」に変更しました(「初動売上枚数」は、発売後1週間以内の売上枚数を指します)。作成しなおしたグラフがこちらになります。

パッと見た感じ、カラオケの定番ヘビロテ、フラゲ、ポニシュシュ、そして我らがフォーチュンクッキーは、直線よりもかなり上にあり、当初のバズり度合いから想定される枚数よりも1週間以上に渡って売れた!ということがしっかり表れています。いい感じです。これなら納得です。
心のプラカードは最新シングルということもあってか、まだ枚数は伸びていないですね。そもそもAKB48が広く認知されるようになったから、時系列構造を入れた方が……。選抜メンバーの構成が影響したんじゃ……。など、まだまだ気になるポイントはありますが、今回はここまで!
ふと気になったことを、仮説にもとづいて分析してみる。お仕事じゃなくて、自分の趣味でいいんです。「データドリブン」の前に、知りたいことを追求してみる「やりたいことドリブン」(※)。そんなときにこそ新たなひらめきを得られるかもしれません。続きの分析が知りたい! という方はぜひ「いいね!」を押してくださいね。ではまた!
※「やりたいことドリブン」は、ネットウォッチャーotsune氏のプレゼン動画のタイトルです
(ニコニコ動画)。
本記事で使用したデータ
・Googleトレンド
・AKB48 シングル売上枚数(Yahoo!知恵袋)
・年代流行
以上のデータをもとに、マーケティングメトリックス研究所にて加工しました。