大統領選の予測として中間値が有効なのではないか、という話。この手の議論は大統領選に限らず色々な事象で展開されているので、嗚呼またか、と思うのである。
Cauchy Distribution (Wikipedia)
分布には様々なデモルが存在するが、中でも扱いのやっかいなものがコーシー分布である。統計量を特徴付けるモーメントのほとんどが定義出来ない為である。分布におけるモーメントとは、連続関数における微分量のようなもので、一次モーメントが平均値、二次モーメントが分散、三次モーメントが歪度、四次モーメントが尖度と続く。歪度は軸対称からの歪みを、尖度は分布の尖りを表す量である。コーシー分布ではこれらの量が有限に定まらないための技術的困難が潜んでいる。しかしそれであっても、中央値は定義出来るのである。いや、そもそも何かしら統計を行えば中央値はかならず定義出来るに決まっている。
事例ごとに異なる値から最汎的な(人工的な)値を作り出すことは用意ではない。しかし、あらゆる事例に共通する値は手を加えることなく全ての事例で一致する。というのはまるで、
世界中の人の肌の色から人を総称するために共通項を探すのは難しい
しかし、世界中の人を総称するのに「人」という語を用いてはどうか?
と言っているようなものなのだ。だから一般の予測について、中央値を参考にするのはある意味当然のアプローチなのである。そしてそれが、概ねの参考値を知りたいだけであればなお更の事である。統計的な参考が欲しい時に人が期待するのは"そこそこ"分布の山の辺りの値であって、裾の彼方ではないのだから。
ところで中央値を利用した大統領選の予想では今のところMcCain上院議員が有力なようだ。
0 件のコメント:
コメントを投稿