반응형

통계학개론 8

[확률변수와 확률분포] 8. 누적분포함수(cumulative distribution function)

1. 누적분포함수의 정의 $F(x) = P(X\leq a)$ : 확률변수 $X$가 어떤 점 $x$보다 작거나 같을 확률 누적분포함수 $F(x)$ 는 다음 조건을 만족합니다. 아래는 $F(x)$ 를 표시하는 방법인데 $\Sigma$와 $\int$에서 무엇을 쓰는지 차이가 있습니다. 예를 들어 $a=2, b=3$ 일 때 확률변수 X의 확률은 $P(2\leq X \leq 3)$ 를 구하는 것과 같습니다. $P(2\leq X \leq 3)$ = $F(3) - F(2)$ 와 같이 쓸 수 있습니다. $P(2\leq X \leq 3)$ 는 3까지의 누적분포함수에서 2까지의 누적분포함수를 빼주는 것과 같습니다. $f(x) = x/5$ 일 때 $P(2 \leq X \leq 3)$ 를 구해봅시다. 예제1. 주사위를 두 번..

통계학개론 2021.02.14

[확률변수와 확률분포] 7. 확률밀도함수(probability density function)

확률변수가 가질 수 있는 값이 {1,2,3, ...} 와 같이 유한개이거나 무한 개의 셀 수 있는 값으로 표현될 수 있을 경우 이산형 확률변수라고 합니다. 예를 들어 가족 구성원의 수, 학과 학생들의 수, 동전 던지기에서 앞면이 나오는 횟수 등 실생활에서 접할 기회가 많습니다. 이산형 확률변수가 나올 수 있는 값의 범위에 대한 확률을 표현할 때 특정 함수를 쓰게 됩니다. 이 함수를 확률질량함수(probability mass function)라고 합니다. 또는 이산형 확률밀도함수라고도 합니다. 확률변수가 아래 조건을 만족하면 이산형 확률변수라고 합니다. ① 이산형 확률변수 X의 범위가 유한하거나 무한개의 셀 수 있는 값을 가지고 있다 ex) 가족 구성원의 수, 동전 던지기의 앞면이 나오는 횟수 등 ② $\..

통계학개론 2021.02.13

[확률변수와 확률분포] 6. 확률변수(random variable)

주사위를 던질 때 4가 나오는 실험을 한다고 합시다. 이 실험에서 표본공간은 아래와 같이 나타낼 수 있습니다. 표본공간(S)={ 4가 안나옴, 4가 나옴} 즉, 주사위를 던질 때 이 두가지 경우가 나옵니다. 이 때 4가 나오는 횟수에 대해 수치적으로 다룰 수 있는 새로운 표본공간을 만들어 보려고 합니다. 당연히 아예 나오지 않거나 한 번 나오겠죠 새로운 표본공간(S'') = {0, 1} 이와 같이 확률실험(주사위를 던지기)을 할 때 새로운 표본 공간의 수 형태로 표현되는데 이를 확률변수라고 합니다. 이렇게 확률변수를 정의하고 나면 확률을 구하는게 간편해집니다. 여기에서는 주사위를 던질 때 4가 나오는 횟수를 확률변수 X라고 정의하면 0 또는 1이 됩니다. 확률변수의 값은 언제든 달라질 수 있는데 이를 일..

통계학개론 2021.02.12

[확률론] 5. 베이즈 정리(Bayes' theorem)

조건부확률의 응용으로 베이즈 정리로 확장될 수 있습니다. 베이즈 정리란 사전확률(prior probability)이 주어졌을 때 사후확률(posterior probability)을 구하는 것입니다. 여기서 사전확률이란 우리가 이미 알고 있는 확률입니다. 즉, 지금까지 경험으로 미루어보아 어떤 사건 A가 일어날 확률이 이정도쯤 되겠지..? 라는 개념입니다. 1. 폐암 발병률이 0.01 이라고 알려져 있다고 가정하면 이때 0.01이라는 값이 사전확률이 될 것입니다. 2. 반면 폐암 발병하지 않을 확률은 1-0.01 = 0.99 이 됩니다. 3. 환자가 폐암이 발병했다고 가정했을 때 폐암 진단이 올바르다고 판단할 확률은 0.9 이라고 합니다. 4. 그렇다면 환자가 폐암이 발병하지 않았다고 가정했을 때 폐암 진..

통계학개론 2021.02.11

[확률론] 4. 독립과 배반사건의 개념

사건을 구분하는 것이 크게 어려운 개념은 아니지만 잘못하면 헷갈릴 수도 있는 개념들입니다. 1. 배반사건 두 사건 A, B가 있을 때 A∩B가 의미하는 바는 A사건과 B사건이 동시에 일어난다는 것이죠. 하지만 동시에 일어나는 사건이 아예 없으면 어떨까요? 예를 들면 주사위를 던지는데 A는 짝수가 나올 사건이고 B는 홀수가 나올 사건이라고 한다면 두 사건이 동시에 일어날 수 있을까요? 당연히 불가능하겠죠 이 때 A∩B= ø 이 성립합니다. 이를 "두 사건 A와 B는 상호배반적이다" 라고 합니다. 2. 독립 추론 통계에서 독립이라는 조건을 이해하는게 중요한데 많은 핵심 개념들이 독립을 전제로 하고 있기 때문입니다. 따라서 매우 중요한 개념이기 때문에 꼭 짚고 넘어가야할 부분입니다. 특히 배반사건과 독립을 구..

통계학개론 2021.02.11

[확률론] 3. 조건부 확률의 정의

조건부 확률(Conditional probability)이란 어떤 사건이 일어났다는 전제 하에 다른 사건이 일어날 확률입니다. 두 사건 A, B가 있을 때, 사건 A가 일어났을 때 B가 일어날 확률은 다음과 같이 표현합니다. 위 밴다이어그램을 보면 쉽게 이해할 수 있습니다. P(B|A)는 A에 대한 A∩B의 확률인 것을 알 수 있습니다. 만약 한 개의 주사위를 던질 때 짝수가 나오는 사건을 A라고 하고, 3의 배수가 나오는 사건을 B라고 했을 때 P(B|A)는 다음과 같습니다. 조건부 확률의 정의로부터 A와 B가 동시에 일어날 확률 P(A∩B)를 다음과 같이 유도할 수 있습니다. 즉, A와 B가 동시에 일어날 확률은 A의 확률과 A가 일어났다는 전제하에 B의 확률을 곱한 것과 같습니다. 예를 들어, 주머..

통계학개론 2020.05.19

[확률론] 2. 확률의 정의

확률이라는 말은 실생활에서도 많이 쓰이는 단어입니다. 학자들마다 확률의 정의가 다른 경우가 있지만 일반적인 정의는 어떤 사건의 경우의 수를 전체 경우의 수로 나누어 계산하는 것입니다. 전 포스팅에서 세 개의 동전을 던지기 실험을 할 때, 표본공간 S는 아래와 같이 나왔습니다. 앞면이 2개 나오는 사건을 A라고 할 때, A가 나올 확률을 P(A)는 다음과 같습니다. 특정 사건의 확률은 0보다 크거나 같으며 모든 사건의 확률의 합은 반드시 1이 되어야 합니다. 확률의 합은 1이기 때문에 사건 A가 발생하지 않는 확률은 다음과 같이 구할 수 있습니다. 한편 두 사건 A, B에 대해선 다음이 성립합니다. 합사건 확률은 A 또는 B 사건이 일어나는 확률을 말하며, 각 사건의 확률을 더하고 동시에 사건이 발생하는 ..

통계학개론 2020.05.13

[확률론] 1. 표본공간과 사건

통계는 데이터를 다루는 목적에 따라 기술통계와 추론통계로 나뉩니다. 기술통계는 수집한 데이터의 정리 및 요약을 통해 데이터의 특성을 밝혀내는 방법입니다. 데이터의 특성은 대푯값을 통해 표현할 수도 있고 그림을 통해서도 나타낼 수 있습니다. 대푯값이란 평균, 분산 등 데이터의 특성을 반영한 하나의 값으로 표현될 수 있습니다. 또한 수치 자료의 구간 별 빈도를 볼 수 있는 히스토그램이나 다양한 종류의 그래프들이 있을 수 있습니다. 이와 같이 기술통계가 뜻하는 바는 누구나 쉽게 이해할 수 있습니다. 주로 통계학이라고 한다면 추론 통계학을 이야기하는 경우가 많습니다. 통계학이 어렵다는 이야기를 하는 경우 대부분이 추론통계일 것입니다. 추론통계에서는 모집단(population)과 표본집단(sample)이라는 개념..

통계학개론 2020.05.11
반응형