選挙の当落

58歳になって、プログラミング言語Pythonを学び始めた。その傍ら、pythonで将来、知識として保持しておくのも意味があるだろうと、 統計学を再復習している。学生時代に計量経済学のためにと統計学を履修していたが、すっかり忘却の彼方へと置かれていた。
さて、テレビでの選挙特番でよく、開票率が低い段階で、当選確実が表示される。なぜ?と思う人もいるだろう。 要点だけをかいつまんで、論じてみたい。超簡潔なので、詳しく知りたければ、ググってみればよかろう。
察しのつく方は、出口調査にあると考えるだろう。正解である。 しかし、その出口調査から、どうして当確が導き出されるのかが、問題であろう。 ここでは、一人区で、二人の立候補者がいるとしよう。それぞれ、A、Bとする。そして、無効票は存在しないとする。 出口調査で全ての有権者から回答が得られ、候補者Aの得票率が50%を超えているなら、当然、当確が出せる。 しかし、都市部の選挙区で数万人の有権者から回答を得ることは、人的に、時間的に、コスト的に困難であろう。 このような全てのものから得るデータを母集団という。統計学は全数調査をしなくても、標本と呼ばれる母集団の一部のデータから、 母集団の持つ特性を推定可能せしめる。その特性とは平均値と標準偏差である。標準偏差とは分散の平方根である。 求める方法は各自確認してほしい。
ここで論じている分布は二項分布と呼ばれるもので、標本数が母集団の平均値と標準偏差を推定するに十分であれば、 左右が対称な正規分布に限りなく近い二項分布になる。 正規分布の特徴には、「平均値 ± 標準偏差2個分の範囲に分布全体の95%が含まれる」がある。 分布は確率を表すので、100%は確率1であるから、95%の確率で平均値 ± 標準偏差2個分の範囲に収まる、とも換言できる。
出口調査で、1,000人から回答を得て、Aに投票した人が50%だったとすると、統計学的計算から 、二項分布での平均値は0.5で標準偏差は0.015である。(そういうものと考えてほしい)。 そうして、正規分布ではこれが、0.5 ± 2 × 0.015=0.5±0.03で、 Aに対する実際の得票率が95%の確率で47%~53%と推定できる。 この場合、95%の確率に収まる下限が50%(0.5マイナス0.03)を切っているので、当確はテレビ画面に表示できない。 下限が54%以上であれば、1,000人で考えた、先ほどの下限の誤差が3%であるから、得票率が51%以上になるので、 当選確実といえる。これが、選挙速報で利用される統計学の妙である。 余談になるが、当選確実が言い得るように、逆に敗退投票率も統計学的に推定できることも加えておく。 さらに、この出口調査の結果にバイアス(偏向)がないとして考えている。


戻る
カテゴリー