サイトへ戻る

自作数列クイズの回答結果と代表値

修士1年 岡島光希

2024年5月10日


代表値とは

 代表値とは,データを代表する指標となる値である.主要な代表値の例としては,平均,中央値,最頻値などがあげられる.以下に,それぞれの定義と特徴を紹介する.

算術平均

算術平均とは,データの観測値の合計を,観測値の総数で割った値である.

 算術平均の特徴は,データ中の全ての観測値が,等しい重みで反映されることである.

 この特徴が役に立つのは,全ての観測値を平等に扱った値が,重要な意味を持つ場面である.例えば,質量分布の算術平均(いわゆる重心座標)は,系内の物質を平等に扱う必要のある古典力学の議論において,運動量や剛体の回転運動などを調べる際に,重要な値となる.

 反対に,算術平均が役に立たないのは,外れ値のあるデータにおいて,分布の普遍的な特性を表す指標を求めたい場面である.例えば,日本の通訳者の違法賭博金額について,算術平均を愚直に計算すると,水原一平氏ただ一人の記録が全体の結果に甚大なる影響を及ぼすことが容易に想像できる.このような値を,分布の普遍的な特性を表す指標とするのは,適切ではない.


中央値

 データの観測値を小さいものから順に並べたとき,ちょうど真ん中に来る値を中央値という.(データ数が奇数(2m+1)の場合,中央値はm+1番目に小さい観測値である.データ数が偶数(2m)の場合,中央値はm番目とm+1番目に小さい観測値の算術平均である.)

 中央値の特徴は,データ中のすべての観測値を反映しない点にある.

 この特徴が役に立つのは,「外れ値の影響を無視したい場面」である.例えば, 10人が同じ100点満点のテストを受けたとして,9人の得点が1~9点の間に収まり,残り1人の得点が100点だった場合,過半数の得点が10点を下回るにも関わらず,100点を取った一人の得点の影響により,平均点は必ず10点を上回ってしまう.このような場合において,分布の代表値として相応しいものは平均ではなく中央値であるといえる.

 反対に,中央値が役に立たないのは,「すべての観測値を反映した値が欲しい場面」,「 観測値のパターンが少ない場面」である.前者について,例えば,「重心座標」に代えて,質量分布の「中央値座標」なるものを考えたとして,中央値座標にない物質の動きは反映されないため,物理的に無意味である.後者について,例えば,2点満点のテスト(各配点1)を実施したとき,得点の中央値は,0,1,2の3パターンしかありえない.この場合,小数点以下の値を得られる平均と比べて,中央値は粗い指標といえる.

パーセンタイル

 中央値の定義を中央以外にも拡張したものであり,各観測値が全体の何パーセントに位置するかを示したものである.観測値の順位をデータ数で割ることで求められる.

 

最頻値

 データに最も多くみられた観測値である.分布の峰に相当する値ともいえる.ただし,分布の峰が複数あったりばらつきが大きかったりする場合には,あまり意味を持たない.

 

自作数列クイズの得点分布

 自作数列クイズをSNSに投稿したところ,26件の回答が得られた.以下がそのクイズのURLである.

 数列クイズの得点分布は図1のようになった.

図1:自作クイズの結果

 図1記載の平均と中央値であるが,これらの値は適切ではないと考える.なぜなら,得点が0の回答は,その内容がすべて問10にのみ何らかの数字を入力したものであり,これは,正答をあてずっぽうで見つけようとする同一人物の回答である可能性が高いからである.そこで,適切な平均と中央値を求めるため,0点の回答をデータから除いて再計算したところ,中央値は40,平均は47.61となった.

 

図2:問題番号と正答率

 クイズ作成時,私は難易度の低い順に問題を並べたつもりであった.その結果,図2より,問5を除けば,問題番号が増えるごとに正答率が低くなった.

 問題1~9は,回答者のモチベーションを保つために,解いていて面白いと感じる問題設計を心掛けた.具体的には,数列に内在する規則をできるだけ単純にしたり,解答に必要な計算量を少なくしたり,といった工夫をした.その結果,問題1~9の正答率はすべて2割以上となった.

 問題10は,全問正解者が簡単には出ないように,難易度を高くした.(なぜなら,本クイズは最初に全問正解した者に賞品を授与するという企画であったため,全問正解者の出現までにはある程度の時間を稼ぐ必要があったのである.)具体的には, 数列に内在する規則を複雑化し,解答に必要な計算も数学的に少々高度なものした.その結果,問1~9と比較して,正答率は圧倒的に低くなった.

 

今回用いたデータの欠点

 今回用いたデータは,「ある属性の人間の得点分布を調査する」という目的においては,以下の4つの欠点があると考えられる.

欠点1 データ数が少ない

欠点2 制限時間が設定されていない

欠点3 同一人物からの複数回の回答が可能になっている

欠点4 自由参加のため,回答者の属性が明らかではない

 

今後のデータ収集活動においては,上記4つの欠点を克服することを心掛けたい.

参考文献

・松原望, 統計学入門, 東京大学出版会, 1991