ちょっとかわった標本調査

- 順位別標本抽出法?(Ranked set sampling-

 

 統計調査には,調査の対象全体をもれなく調べる全数調査と,その一部を抜き出して調べ,それから全体を推測しようする標本調査があります.全数調査は正確なことがわかります.しかし,時間や費用のことを考えると,多くの場合,標本調査が用いられます.

 標本調査では,調べようとする対象全体を母集団といい,調査のために母集団から抜き出された要素を標本といいます.標本を抜き出すことを標本抽出といい,標本に含まれる要素の個数を標本の大きさといいます.

 ここでは,母集団の要素には1からまでの番号がつけられており,対応する要素の値をとします.そして,標本から,母集団の平均(母平均

                                    (1)

を求める(推定)問題について考えます.

基本になるのが,無作為抽出による標本(無作為標本)を用いて推定する方法です.大きさの無作為標本は,次のようにして求めます.母集団の要素が個ですから,1からまでの番号札を容器に入れ,よくかき混ぜて枚の番号札を戻さずに次々に抜き出します.抜き出された札と同じ番号の要素が無作為標本です.そして,この無作為標本の要素の値を測定し,得られた値をとします.この測定値から,標本平均

                                  (2)

を求め,で母平均を推定します.これを単純無作為標本による推定法といいます(以下略してSRSという).

 ここからが,本題である,順位別標本抽出法(Ranked set sampling)の話になります.推定に用いる測定値は,次のようにして求めます.1回目は,まず,母集団から大きさ2の無作為標本を選びます.そして,抽出された2個のうちの小さいほうを測定し,その値をとします.次に,残りの母集団(要素が2個減っている)から,また,大きさ2の無作為標本を選びます.そして,今度は抽出された2個のうちの大きいほうを測定してとします.2回目は,残りの母集団(要素が個)を1回目の母集団と考えて,1回目と同じようにして,を求めます.これを回繰り返して,回目にはを求めます.1回に4個の要素が必要ですから,残りの母集団の要素を考えると,について,が成立していなければなりません.このようにして得られた個の測定値ranked set sampleといわれるものです.これらの測定値の平均

                      (3)

を求め,で母平均を推定します.これをranked set samplingによる推定法といいます(以下略してRSSという).

 この2つの推定法,SRSRSSを簡単に比較してみます.式(2)も,式(3)のいずれも標本抽出のたびに変化する値です.これらの変化する値をそれぞれについて平均すれば,いずれの場合も母平均になります.また,測定値が同じ個数のときに,変化する値の散らばりの指標である分散については,

 

(i)    

(ii) あいまいな言い方ですが,母集団が正規分布的な密度からのものであれば,の1.5倍以上になっている.

 

になることが知られています.(ii)は,RSS の10個の測定値で,測定値15個のSRSに相当し,5個分測定しないで精度をよくすることができるということになります.

まとめになりますが,RSSの適用は,母集団の各要素の測定は困難であるけれど,2つの要素の大小が容易にわかるときに有効です.人は,視覚で大小,多い少ないなど,簡単にわかる場合も多いと思います.例えば,木の高さや面積などがそうではないでしょうか.10年位前に,私のセミナーにりんご農家の学生がいました.りんごの数が,多い木か,少ない木かを,視てすぐに正しく判断できるかどうか,その学生の農園で,実験しました.4人別々に,同じ15組を判定しました.結果は,間違えたのが15組のうち1組で,しかも一人の誤りだけでした.もちろん,後で,実験に使用した30本の木のりんごをカウンターで数えましたが,こちらのほうが大変でした.

Ranked set samplingについては,いろいろ研究されてきています.Ranked set samplingの日本語訳は,まだ,ありません.順位別標本抽出法は,私が勝手につけただけで,日本語の統計用語にはなっていません.

感覚(視覚)情報をうまく利用すれば得になるという話でした.

(文責 二ツ矢)