ロングテールとパレートの法則に関する誤解
Web2.0を語るキーワードの1つに「ロングテール」がありますが、この言葉を巡っては多くの誤解があります。その誤解の1つはロングテールが従来の80:20の法則を覆すものだということです。
これに関しては、Long Tailの提唱者Chris Andersonが最初に示したAmazonが売上の57%を上位10万以下の商品からあげているという衝撃的な報告から端を発しています。しかしその後、Chris Anderson自身がブログでこの数値を36%から20%後半へと下方修正しています(参考:A methodology for estimating Amazon's Long Tail sales)。57%から20%後半となると数字的には大きな違いがあり、「さんざん煽っておいてなんだ」と批難の声も上がっているようですが、問題の本質としてはその割合が何対何になっているかということではありません。もともとパレートの法則と対比して語られることもあるロングテールですが、実際にはパレートの法則の1バリエーションでしかありません。ここにそもそもの誤解が存在するのです。
一方でパレートの法則そのものに対する誤解もあります。1897年に、イタリアの社会・経済学者ヴィルフレッド・パレートが発見したパレートの法則は、彼が1880~90年代のヨーロッパ経済を統計的に分析した上で、個人の所得金額(x)とその所得金額以上の所得を得ている人の数との間に、定数aとパラメータαに媒介される、 Rx=ax-αという関係が成立することを示したものです。
パレートの法則を80:20の法則と呼んだりしますが、実はこの呼び方が誤解のもとです。上記の式はパラメータαが可変であるため、上位20%に対する比率は決して固定されるものではありません。実際、パレート自身は一度も80:20の法則という言葉を使ってはいないと言われています。つまり、重要なのは80:20という比率ではないということです。パレートの法則が示すのは、一部の少数者が多くを独占するといった極度に偏った分布が存在しているということなのです。
では、下の2つのグラフを見てみてください。
グラフ1は、パレートの法則に類似する式を元に作成した数値をグラフ化したものです。左側ではほぼ平らだと思える形で推移した後、右側で急激に数字が伸びる典型的なロングテールの分布を示しているのがわかると思います。グラフ2は同じ式を両対数グラフ(x、y軸ともに数値を対数化したグラフ)で表現しなおしたものです。パレートの法則のように、少数者が多く占めるような分布は対数表現した場合、直線を描く性質はあります。パラメータαの値を変えると、この直線の勾配は変化します。勾配がゆるくなるほど、ヘッド部分とテール部分の格差が縮まり、いわゆるロングテールになるわけです。