통계학개론

[확률변수와 확률분포] 6. 확률변수(random variable)

love R 2021. 2. 12. 16:56
반응형

주사위를 던질 때 4가 나오는 실험을 한다고 합시다.

이 실험에서 표본공간은 아래와 같이 나타낼 수 있습니다.

 

표본공간(S)={ 4가 안나옴, 4가 나옴}

 

즉, 주사위를 던질 때 이 두가지 경우가 나옵니다.  이 때 4가 나오는 횟수에 대해 수치적으로 다룰 수 있는 새로운 표본공간을 만들어 보려고 합니다. 당연히 아예 나오지 않거나 한 번 나오겠죠

 

새로운 표본공간(S'') = {0, 1}

 

이와 같이 확률실험(주사위를 던지기)을 할 때 새로운 표본 공간의 수 형태로 표현되는데 이를 확률변수라고 합니다. 이렇게 확률변수를 정의하고 나면 확률을 구하는게 간편해집니다. 여기에서는 주사위를 던질 때 4가 나오는 횟수를 확률변수 X라고 정의하면 0 또는 1이 됩니다.

 

확률변수의 값은 언제든 달라질 수 있는데 이를 일반화하여 나올 수 있는 경우의 모든 값의 형태를 나타낸 것을 확률분포(probability distribution)라고 합니다. 즉, 확률분포는 확률변수의 모든 가능성에 대해 일반화하여 나타낼 수 있다는 것입니다.

 

 

위 주사위 던지기에서 확률분포는 다음과 같이 나타낼 수 있습니다.

 

 

표본공간에 대응하는 원소로 구분하면,

 

 

 

그래프로 나타내면 한 눈에 보기에 더 쉽습니다.

 

 

 

 

위와 같이 확률변수 X의 값의 범위가 유한하거나 셀 수있는 값으로 표현될 때 X를 이산형 확률변수(discrete random variable) 라고 합니다. 이산형 확률변수의 분포 형태를 나타내는 것을 확률질량함수(probability mass function)이라고 합니다.

 

반면 확률변수의 값을 셀 수 없거나 그 범위가 무한한 경우에는 연속형 확률변수(continuous random variable) 라고 합니다. 연속형 확률변수의 분포 형태를 나타내는 것을 확률밀도함수(probability density function)이라고 합니다.

 

우리에게 익숙한 확률분포는 가장 대표적으로 정규분포(normal distribution)가 있죠. 정규분포는 많은 자연 현상을 수치적으로 다룰 수 있기 때문에 매우 중요하게 다뤄지죠. 이렇듯 확률변수는 크게 두 가지로 구분되는데 확률변수의 형태에 따라 확률분포가 정해집니다.  이산형과 연속형에 대해서는 다음 장에서 자세히 알아보도록 하겠습니다.

 

 

반응형