最近号のメールマガジン
第68回 視聴率操作と統計学[top]
2003年12月05日発行
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
国経館 視聴率操作と統計学 メールマガジン No.130
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
みなさん,こんにちは.笹山です.
このメールマガジンは国際経済学科のメールマガジン「国経館」の1つとして,
国際経済学科のすべての学生に配信されています.
今回は,視聴率と統計学に関する話題です.
マクロ経済学のメールマガジンとしてはNo.68です.
------------------------------------------------------------
【第130号】 視聴率操作と統計学
------------------------------------------------------------
日本テレビのプロデューサーが担当したテレビ番組の視聴率を意図的に上げる
ために,視聴率調査の機械を設置している世帯を探偵会社に依頼して探させ,
実際に視聴率操作をしていたというニュースはテレビ関係者だけでなく多くの
方にも衝撃を与えました.
このニュースの過程で「視聴率」の実態が明らかになりました.
問題を起こした日本テレビのプロデューサーが担当した番組の1つ「軌跡の生
還芸能人版」(2003年9月24日放送)の視聴率は10.2%でした.こ
の数字は関東地区の600世帯を調査した数字なのですが,発表するときは関
東地区1600万世帯のうち10.2%(163万2000世帯)の世帯があ
たかも同番組を見たという形で報道されます.
われわれがこのニュースで初めて知ったのは,視聴率調査会社のビデオリサー
チ社がどのぐらいの世帯数に視聴率調査の機械を設置していたのかという事実
でした.
1600万世帯と600世帯というあまりにもかけ離れた数字を示されて,多
くの人が「たった600世帯しか調査していないんですか!?」という驚きの
声をあげたのは,ごく自然な反応だったのではないでしょうか.
ビデオリサーチ社は,統計理論に基づいて調査世帯数を決めているから問題な
いというようなことを述べているのですが,はたしてそうなのでしょうか.
600という数はどのような理論で正当化されているのかを今回は検討してみ
ましょう.
■調査世帯数の標本の数の決め方
視聴率調査の対象となる関東地区の世帯数は全部で1600万世帯です.16
00万世帯全部を調査したら大変な費用と手間がかかるので,通常は統計的な
手法に基づいて限られた数の世帯数だけに視聴率調査を行います.関東地区の
全世帯を「母集団(ぼしゅうだん)」と呼びます.選んだ世帯を「標本(サン
プル)」といいます.
「標本」から「母集団」の特徴を見つけようとするわけです.そこで重要にな
るのは,「標本」としてどれぐらいの数の世帯を選べばよいのかということで
す.少ない標本だと費用は安上がりですが母集団との誤差が大きくなりすぎま
す.標本を大きくすれば母集団との誤差は小さくなりますが,費用がかさみま
す.視聴率調査会社(ビデオリサーチ社)は,統計理論に基づいて600世帯
という数を選んだということですが,どのようにしてこの600が出てきたの
かを検証してみましょう.はたして600という数は多くの方が直観的に感じ
るように「少なすぎる」のか.あるいはビデオリサーチ社がいうように十分な
数なのか.
--------------------------
※ここから次の※までは,若干専門的になりますので,結果だけを知りたい方
はこの部分を飛ばして読んでもかまいません.
・中心極限定理
母集団を調べないで,それの一部を構成している標本を調べればよいという考
えの背景にある統計理論が「中心極限定理」です.母集団の数と標本の数が大
きい場合(50以上)には,標本の平均は近似的に正規分布(平均μ,標準偏
差σ/SQRT(n))に従うというのが中心極限定理です.正規分布というのは平
均をはさんで左右対称の釣り鐘状の形をとる分布のことです.
(補足)得点を横軸に,人数を縦軸にとると,まともなテストであれば得点分
布は平均点をはさんで正規分布するといわれています.
母集団から選んだ標本世帯を対象に,ある番組を見た場合は1,見ない場合に
0を割り当ててその平均をとれば平均視聴率を計算することができます.標本
の取り方はたくさんあるのでそれに対応して平均視聴率もたくさんえられます.
それらの平均値の分布をグラフにすると近似的に正規分布になるとみなしてよ
いということです.
標本分布については次の性質があります.
1)標本平均は正規分布に従い,標本分布の平均は母集団の平均(母平均)に
等しい.
2)標本分布の標準偏差(ばらつきの程度を示し,シグマ記号σで表す)は,
母集団の標準偏差を標本の大きさ(n)の平方根で割った値に等しい(=σ/
SQRT(n)).
3)正規分布では,標本平均が母集団の平均から標準偏差の1.96倍の範囲
内に入る確率は95%である.95%(あるいは0.95)を信頼係数といい
ます.
標準正規分布(平均0,分散1)の確率密度関数
3)を記号を使って書くと次のようになります.
Pr{μ - 1.96*σ/SQRT(n) < Xbar < μ + 1.96*σ/SQRT(n) } = 0.95
ここで,Prは確率を表す記号(Probability)で,Xbarは標本平均です.
SQRTは平方根を表します.
母集団の数をN,標本の数をnとおきます.
i番目の世帯があるテレビ番組を見たときはxi=1であり,見なかった場合は
xi=0です.この母集団におけるテレビ視聴率をPとおきます.このとき,母
集団の中でこのテレビ番組を見た世帯数はNP,見なかった世帯数はN(1−
P),従って母集団の平均μは
1
μ=-----(NP・1 + N(1 - P)・0)= P (1)
N
すなわち,母集団の平均は母集団の中の視聴率に一致します.
上の標本分布の性質1)から標本平均は母集団の視聴率Pと一致します.
次に母集団の分散(データのばらつきを示す指標,標準偏差の2乗)σ^2は
1
σ^2=-----(NP(1 - μ)^2 + N(1-P)(0 - μ)^2) = P(1 - P) (2)
N
上の性質3)から,
Pr{μ-1.96*SQRT(σ^2/n) < Xbar < μ + 1.96*SQRT(σ^2/n) = 0.95
あるいは
Pr{μ-1.96*SQRT(P(1 - P)/n) < Xbar < μ + 1.96*SQRT(P(1 -
P)/n) = 0.95
これを変形すると,次のようになります.
Pr{Xbar-1.96*SQRT(P(1-P)/n)<μ<Xbar+1.96*SQRT(P(1-P)/n)=0.95 (3)
(3)式は標本を抽出する前において,母集団の平均(=視聴率)がXbar-1.
96*SQRT(P(1-P)/n)とXbar+1.96*SQRT(P(1-P)/n)の間に入る確率が0.95で
あることを意味しています.(3)の左辺を信頼区間といいます.
(注)なぜ上のような式で書けるかについては,以下の参考文献で紹介した鳥
居(1994)PP.145-147 を参照してください.
※--------------------------------------------------------
視聴率の調査は標本調査で母集団の全体を調査するわけではありませんが,
(3)のような区間推定を行うことで,標本平均(視聴率)の誤差をある一定範
囲内に収める確率を十分大きくすることができます.
(3)から,標本平均と母平均の誤差(Xbar - μ)の絶対値が,
1.96*SQRT(P(1-P)/n)
を超える確率は5%です.つまり次の関係があります.なお,SQRTは平方根を,
P(1-P)は分散ですが,Pは視聴率でもあります.
目標誤差 = 1.96*SQRT(P(1-P)/n)
上式から,標本数nについて解くと,
n=(1.96/目標誤差)^2 *P(1 - P)
必要な標本数=(1.96/目標誤差)^2 *P*(1 - P) (4)
上で,P*(1-P)の部分は本来は母集団の分散で,わからない値です.そこで分
散が最も大きくなる最悪の場合を想定してこの部分を設定します.P*(1-P)が
最大となるのはP = 1/2 のときです.
★ 必要な標本数=(1.96/目標誤差)^2 *0.5*(1 - 0.5) (5)
従って(5)式から目標とする誤差(標本平均と母集団との間の)を設定すれ
ば,それに応じて必要な標本数が求められます.(5)に基づいて,許容する
最大誤差と標本数の関係を表の形で整理しておきましょう.
(表1)誤差と標本数の関係
---------------------------------
許容する最大誤差 標本数
---------------------------------
0.01 9604
0.02 2401
0.03 1067
0.04 600 ビデオリサーチ社の選択
0.05 384
0.06 266
0.07 196
0.08 150
0.09 118
0.10 96
----------------------------------
上の表からわかるように,ビデオリサーチ社の視聴率調査では視聴率の許容す
る最大誤差を4%と設定して,標本数(調べる世帯数)を600世帯と決めて
いることがわかります.標本数を1000世帯あるいは10000世帯とすれ
ばそのときの最大誤差はそれぞれ3%と1%になりますが,標本数を600世
帯,1000世帯,10000世帯とした場合について,視聴率の誤差がどの
程度になるかを表に整理してみましょう.
計算式は 1.96*SQRT(P*(1-P)/n) を使います.Pは視聴率,nは標本数です.
(表2)標本数と視聴率の誤差
-----------------------------------------------------------------
視聴率 標本数600 標本数1000 標本数10000
-----------------------------------------------------------------
0.05 0.0174 0.0135 0.0043
0.10 0.0240 0.0186 0.0056
0.149 0.0285 0.0221 0.0059
0.15 0.0286 0.0221 0.0070
0.20 0.0320 0.0248 0.0070
0.30 0.0367 0.0284 0.0078
0.40 0.0392 0.0304 0.0090
0.50 0.0400 0.0310 0.0096
0.60 0.0392 0.0304 0.0096
0.70 0.0367 0.0284 0.0090
0.80 0.0320 0.0248 0.0078
-----------------------------------------------------------------
上の表(グラフ)は次のように読みます.視聴率が10%のとき標本数(調査
世帯数)が600の場合の誤差はプラス・マイナス2.4%,標本数が1000
の場合はプラス・マイナス1.86%,標本数が10000の場合は0.56%
です.世帯数600の調査の場合,実際は7.6%から12.4%の範囲に入
る可能性があります.10000世帯ぐらいまで標本数を増やせばかなり誤差
を縮小させることがわかります.
視聴率操作をした日本テレビのプロデューサーは「視聴率が14.9%と15.
0%では大違いであり」と調査委員会に対して述べていますが,上の表で見る
とおり,視聴率0.1%は誤差の範囲に入ってしまうのです.
さらに調査委員会の報告書では「視聴率への影響は最大0.5%」と指摘して
いますが,これも誤差の範囲内です.
今回の事件は,視聴率の数字を神聖化してしまったことに問題があります.こ
のプロデューサーは某大学の社会学部出身ですが,大学でもっと統計学を学ん
でおけばよかったですね.それと同時にわれわれも視聴率を絶対的なものでは
なく上で示したようにかなりの誤差を伴っているということを再度認識すべき
でしょう.
さて,ビデオリサーチ社の調査世帯数600では,視聴率に最大で4%の誤差
がでます.これはちょっと大きすぎるでしょう.われわれが視聴率に期待する
誤差は1%ぐらいが妥当なところではないでしょうか.そうすると,調査世帯
は少なくとも3000から5000世帯は必要になります.10000世帯ま
で増やせばほぼ完璧です.このぐらいまでの標本調査をしてくれるのなら「視
聴率」を信用してもいいでしょうが,現在ではかなりおおざっぱな数字とみる
のが無難です.
■標本の選び方(サンプリング)
次に標本の選び方についても簡単に整理しておきましょう.ビデオリサーチ社
のサイトによれば,「系統抽出法」という方法で標本となる世帯を選んでいる
ことがわかります.基本的には「無作為抽出法」と呼ばれる手法の1つです.
何の意図も持たずにランダムに調査世帯を選ぶ方法です.
関東地区1600万世帯(N)が母集団で,600世帯(n)が視聴率調査世
帯標本です.母集団には1番から1600万番まで番号をふっておきます.1
600万を600で割った数字2666が1グループ内の世帯数となり,世帯
と世帯との間隔(インターバル)にもなります.初めのグループから無作為に
(通常は乱数表を使って2666より小さい数字を1つ選びます)1世帯を選
びます.最初の世帯を選んだら,その後はインターバルの数字2666を順繰
りに足していくと等間隔で600の数の世帯を選ぶことができます.このよう
な標本の選び方が系統抽出法です.
テレビや新聞社が政党支持調査などでよく使うサンプリングの手法は「層化2
段無作為抽出法」です.有権者の政党支持の世論調査のような場合は,男性と
女性,あるいは若者と年長者のように母集団が一様ではなくいくつかの層に分
かれていると見た方が正確である場合があります.このような場合には「層別
抽出法」が使われます.さらに全国規模で世論調査をする場合は,母集団を全
国のままで番号づけするのは困難です.このような場合は,まず全国からいく
つかの市町村を選び出し,次にその中から世帯を選んでいきます.このような
方法を「多段抽出法」といいます.上の2つを組み合わせたのが層化2段無作
為抽出法」です.テレビの世論調査のニュースにはしばしば登場する用語です
ので注意して見てください.
■標本数と統計理論関連サイト
・ビデオリサーチ社
日本で唯一視聴率調査をしている会社です.以前はニールセンという会社も視
聴率調査を行っていました.
視聴率とは--目次:
http://www.videor.co.jp/rating/wh/contents.htm
★標本誤差:
http://www.videor.co.jp/rating/wh/07.htm
標本世帯数が600であることを明らかにしています.
サンプリング手法(標本世帯の選び方):
http://www.videor.co.jp/rating/wh/04.htm
系統抽出法の説明があります.
視聴率のデータ:
http://www.videor.co.jp/data/ratedata/r_index.htm
1996年11月からの視聴率のデータを見ることができます.
ジャンル別の最高視聴率などのデータも整理されています.
・標本はいくつ集めたらよいか(兵庫教育大学 成田滋先生):
http://www.ceser.hyogo-u.ac.jp/naritas/spss/sample_size/sample_size.htm
・母比率の区間推定のとき(群馬大学 青木繁伸先生):
http://aoki2.si.gunma-u.ac.jp/lecture/SampleSize/pconf.html
・実務に役立つデータ分析,選挙予測調査の簡単統計(日経リサーチ):
http://www.nikkei-r.co.jp/report/9604/data.htm
選挙の予測も基本的には視聴率調査と同じ手法が適用できます.
■日テレ視聴率操作関連サイト
asahi.com 日テレ視聴率操作特集:
http://www.asahi.com/special/ntv/
視聴率操作調査委員会の報告(2003年11月18日)
視聴を頼んだ世帯は十数世帯で,承諾したのは6世帯.このうち実際の視聴率
調査対象は3世帯で「視聴率への影響は最大0.5%」
工作費用に875万2584円を使用.番組製作費用から水増し請求で捻出.
日本テレビ 「視聴率操作」に関する調査報告書(2003年11月18日)
http://www.ntv.co.jp/info/news/20031118.html
Aプロデューサー「調査会社に頼んで視聴率調査世帯を探してもらえば20軒
くらいはすぐに見つかるだろうし,その世帯に依頼すれば簡単にOKして自分
の指定する番組を見てもらえるだろうと考え,本件視聴率工作を思い立った.
これにより担当番組の視聴率が0.1%しか上がらなかったとしても,14.
9%と15.0%では大違いであり,不正工作による結果であったとしても視
聴率が上がることはうれしいしいことだった(抜粋引用).」
■参考文献
中村隆英・新家・美添・豊田(1993)『経済統計入門[第2版]』東京大学
出版会
東京大学教養学部統計学教室編(1994)『人文・社会科学の統計学 基礎
統計学II』東京大学出版会
上の2冊には,標本数の選び方や系統抽出法をはじめとして代表的なサンプリ
ングの手法が解説してあります.
鳥居泰彦(1994)『はじめての統計学』日本経済新聞社
サンプリングの手順や正規分布の性質などをわかりやすく丁寧に説明してあり
ます.
■まとめ------------
・ビデオリサーチ社の視聴率調査では関東地区1600万世帯のうち,調査し
ているのは600世帯だけである.
・目標とする誤差(標本平均と母平均との差)を設定しないと,調査する標本
数(世帯数)は決まらない.
・ビデオリサーチ社は,最大誤差4%を許容して,600世帯を標本として選
んでいる.
・誤差を1%ぐらいに縮小するのなら3000から5000世帯は調査する必
要がある.
・テレビの視聴率が発表されたら,それは最大誤差プラス・マイナス4%の可
能性を含んでいることをわれわれは知るべきである.
・同時に視聴率調査会社は,視聴率発表時には誤差の%を常に掲示すべきであ
る.
・視聴率調査や選挙の当落調査には必ず誤差が付きものであることを知るべき
である.
-------------------------------------
【課題】
許容する最大誤差を1%と設定した場合は,調査する世帯数はどのぐらいにす
ればいいでしょうか? (5)式に基づいて計算してみましょう.
(注意)後日サイトにアクセスした場合,サイトの構成に違いがでてきたり,
URLが変更になっている場合がありますので,了解してください.
(アクセス日)2003年12月5日
------------------------------------------------------------
【Q & A】標本調査で標本数を決めるには何を設定すればよい?
→ 目標とする最大誤差
【今回のサイト】 ビデオリサーチ社,視聴率とは:
http://www.videor.co.jp/rating/wh/contents.htm
【評価】★★★
私の評価の基準:最高が★★★,次が★★,最後が★です.
★1つは普通という評価です.
データが十分提供されているかどうかが評価のポイントです.
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
【発行】 熊本学園大学 経済学部 国際経済学科
【著者】 笹山 茂
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
Copyright 2003