Sample survey - Hyohonchosa (English spelling)

Japanese: 標本調査 - ひょうほんちょうさ(英語表記)sample survey
Sample survey - Hyohonchosa (English spelling)

It is also called a sampling survey. There are two types of statistical surveys: complete surveys and sample surveys. A complete survey is one in which all survey subjects are surveyed one by one. In contrast, a sample survey is one in which a portion of the survey subjects is extracted and surveyed, and the characteristics of the entire survey subjects are inferred from the results. It would be fine if a complete survey was easy to carry out, but sometimes it is not possible. Even if it is not impossible, it is often not practical in terms of cost, effort, time, etc. In such cases, a sample survey is used.

In the case of a sample survey, the entire original survey subjects are called the population, and a portion of the original survey subjects (which are surveyed) is called the sample. The size of a population is the number of components of the population, and the size of a sample is the number of components of the sample.

In a sample survey, only a sample drawn from the population is examined, so the sample must not be biased. The sample must be selected so that it reflects the characteristics of the population as well as possible. In this case, knowledge of the population must be utilized as effectively as possible. One method is for the person planning the survey to use their own knowledge and experience to select the sample that is believed to be the most representative. This method is called purposeful sampling. It is fine if there is objective guarantee that the sample selected in this way reflects the characteristics of the population well, but if not, there is a risk of obtaining a biased sample.

Currently, the method of introducing a probability distribution into the population and using a sample drawn probabilistically is widely used as a sampling method. The advantages of this method are that it is possible to reasonably estimate the error due to the sample and that it is possible to conduct a survey that meets the requirements for precision.

In the simplest case, when a population is assumed to be homogeneous, a sampling method is used that ensures that every element of the population has the same probability of being drawn. This method is called (simple) random sampling.

In practice, a random number table is usually used to randomly extract a sample of size n from a population of size N. Let us explain how to do this. Here, let's assume N=486, n=20. Start with any number in the random number table, and tick each number in three digits. In this way, 001, 002, ..., 999,000 will appear with equal probability. If 487, 488, ..., 999,000 appears, skip it. Also, if the same three-digit number appears, skip that number. From the series of three-digit numbers thus produced, take the first 20 numbers.

Next, let us consider the case where a population consists of several heterogeneous subpopulations. When a population is divided into several disjoint subpopulations, these subpopulations are called strata. If there are k strata, and samples of size n 1 , n 2 , …, n k are independently drawn from each stratum by simple random sampling, a sample of size n (n=n 1 +n 2 +……+n k ) is obtained from the original population. This method is called stratified random sampling. In this case, if the size of the original population is N and the size of each stratum is N 1 , N 2 , …, N k , the method of selecting the size of the sample n i in each stratum in proportion to the size of the stratum N i is called proportional allocation.

There is also a method called systematic sampling or equal interval sampling for extracting a sample of size n from a population of size N. With this method, all elements of the population are assigned consecutive numbers, and only the first number is selected randomly, after which numbers at regular intervals are selected so that the total number is n. This method is used when conducting interview surveys of passersby, or when conducting a sample survey of patients who come to a hospital. The advantage of this method is that the sampling operation is simple, but care must be taken to avoid biased samples.

Next, we will explain the two-stage sampling method. Divide a population of size N into k groups, and let the sizes of each group be N 1 , N 2 , ..., N k (N=N 1 +...+N k ). Give the i-th group a probability of N i /N, and extract one of the k groups. Next, extract a sample of size n from that group. This method is called two-stage sampling. Multi-stage sampling has also been considered.

[Shigeru Furuya]

Source: Shogakukan Encyclopedia Nipponica About Encyclopedia Nipponica Information | Legend

Japanese:

サンプリング調査ともいう。統計的調査には全数調査と標本調査とがある。調査対象全体について一つ一つ調査するのが全数調査である。これに対して、調査対象の一部を抜き出して調査し、その結果から調査対象全体の性質を推測するのが標本調査である。全数調査が簡単に実行できればそれでよいが、全数調査が不可能なこともある。また不可能でないにしても、費用、労力、時間などの面で現実問題として不適当なことが多い。このような場合に標本調査が利用される。

 標本調査の場合に、もとの調査対象全体を母集団とよび、もとの調査対象から抜き出された一部分(それについて調査する)を標本とよぶ。母集団の大きさとは母集団の構成要素の個数であり、標本の大きさとは標本の構成要素の個数である。

 標本調査では、母集団から抜き出した標本だけについて調べるのであるから、標本が偏ったものであってはならない。母集団の性格がよく反映されるように標本を選ばなくてはならない。この場合、母集団に関する知識はできるだけ効果的に活用する必要がある。調査を企画する人が、自分の知識や経験を生かしてもっとも代表的と思われる標本を選ぶ方法がある。この方法を有意抽出法という。この方法で選ばれた標本が母集団の性質をよく反映しているという客観的保証がある場合はよいが、そうでない場合は偏った標本が得られる危険性がある。

 現在は、母集団に確率分布を導入し、確率的に抜き出した標本を用いる方法が標本調査法として広く用いられている。この方法の長所は、標本による誤差を合理的に推定できること、また精度に関する要求に見合った調査が可能になることなどである。

 もっとも簡単な場合として、母集団が等質であると考えられるとき、母集団のどの要素も同じ確率で抜き出されるようにする抽出法がある。この方法を(単純)無作為抽出法という。

 実際に大きさNの母集団から大きさnの標本を無作為抽出するには乱数表を用いるのが普通である。その方法を説明しよう。ここではN=486,n=20としておく。乱数表の任意の数字から始めて、次々に3桁(けた)でくぎってゆく。そうすると001,002,……,999,000が同じ確率で現れてくる。ここで487,488,……,999,000が出た場合にはそれを飛ばしてゆく。また同じ3桁の数が出たときもその数は飛ばしてゆく。こうしてできる3桁の数の系列から初めの20個をとればよい。

 次に母集団がいくつかの異質の部分母集団よりなる場合について考えよう。母集団がいくつかの互いに共通部分のない部分母集団に分割されるとき、この部分母集団のことを層とよぶ。層の数がk個あって、各層から独立にそれぞれ大きさn1、n2、……、nkの標本を単純無作為抽出すると、もとの母集団から大きさn(n=n1+n2+……+nk)の標本が得られたことになるが、このような方式を層別無作為抽出法という。この場合にもとの母集団の大きさをN、各層の大きさをN1、N2、……、Nkとするとき、各層の標本の大きさniを層の大きさNiに比例するようにとる方法を比例割当法という。

 また、大きさNの母集団から大きさnの標本を抜き出すのに系統的抽出法または等間隔抽出法とよばれる方法がある。この方法では、母集団の要素全体に一連番号をつけておき、初めの一つの番号だけを無作為に選び、あとは一定間隔の番号のものを選んで全体がn個になるようにするのである。この方式は、通行人から聞き取り調査をする場合、病院へきた患者からその一部を抽出調査をする場合などに用いられる。抽出操作が簡単な点は長所であるが、偏りのある標本にならないように注意する必要がある。

 次に二段抽出法を説明しよう。大きさNの母集団をk個のグループに分け、各グループの大きさをN1、N2、……、Nkとする(N=N1+……+Nk)。第iグループに確率Ni/Nを与えて、k個のグループのうちの一つのグループを抽出する。次にそのグループの中から大きさnの標本を抽出する。この方法を二段抽出法という。また多段抽出法も考えられている。

[古屋 茂]

出典 小学館 日本大百科全書(ニッポニカ)日本大百科全書(ニッポニカ)について 情報 | 凡例

<<:  Sample distribution - Hyohonbunpu

>>:  Specimen - Hyohhon (English spelling) specimen

Recommend

Identity - identity (English spelling)

It refers to the fact that an individual thing co...

Anderson, DD

...A site on a river terrace in the middle reache...

Wilson effect

...They have also discovered that sunspots appear...

Hyperpolarization -

…The excitatory postsynaptic potential is a depol...

Khawarij - Khawarij is

The first political and religious party in Islam. ...

Adultery -

…However, there was discrimination against legiti...

aqua aurea (English spelling) aquaaurea

...In Ireland, they are said to be a favorite pla...

Surkh Kotal (English spelling)

...In Indian and Byzantine historical documents, ...

Fair, JG (English spelling) FairJG

...In Spanish, it means "good weather,"...

English Suite

...From around the year 1720, Bach's interest...

Hydra (Sea Snake)

Abbreviation: Hya. A horizontally elongated conste...

Shell Necklace - Shell Necklace

…Such valuable shell money is nothing more than a...

Albi (English spelling)

The capital of the Tarn department in southern Fra...

supporting feature

... As the novelty of early talkies faded and the...

Macedonia

…Official name = Republic of MacedoniaRepublika M...