안녕하세요
푸디헬스입니다^^
오늘은 확률분포의 기초에 대해 포스팅해보겠습니다~
- R에서의 확률분포 함수
- 밀도함수(pdf) : density function of some distribution ex) dnorm : density function of normal distribution
- 누적분포함수(cdf) : probability function of some distribution ex) pnorm : probability function of normal distribution
- 분위수 함수 : quantile function of some distribution ex) qnorm : quantile function of normal distribution
- 난수발생 : random number generation function ex) rnorm : random number generation function from normal distribution
정규분포
저희는 가장 먼저 확률밀도 함수와 누적분포함수에 대해 배워볼까요?
- dnorm( x, mean = , sd = ) : mean - 평균, sd - 표준편차
- pnorm( x, mean = , sd = ) : mean - 평균, sd - 표준편차
평균을 바꾸어보기
x = seq(-5, 5, length = 100) : -5~5까지 등간격으로 100개의 x생성(x좌표를 생성한거에요)
xlim(x limit) = c(-5, 5) : plot을 그릴때 x축의 크기를 지정해줍니다 (plot에 x축 -5~5)
ylim(y limit) = c(0,1) : plot을 그릴때 y축의 크기를 지정해줍니다(plot에 y축 0~1)
lines는 기존의 plot에 겹쳐서 그려줍니다. lty(line type)
legend는 앞에 포스팅했던 Chapter8 - Rgraph에 설명되어있어요!(잘모르시는분은 앞의 포스팅을 봐주세요!)
표준편차 바꾸어보기
누적분포함수
분위수 구하기
X ~ N(3,2^2)인경우. 즉 평균이 3 분산이 4인 정규분포에서 95% 분위수를 구하는 코딩은!
이 분위수를 그림으로 표시해보면 pdf에서는 다음 붉은 선의 왼쪽 면적이에요!
abline 까먹지 않으셨죠? ( plot에 수직, 평행 또는 직선을 그리는 함수입니다)
까먹으신분은 Chapter8 - Rgraph 포스팅을 참고해주세요^^
cdf에서는??
rnorm
평균이 10이고 분산이 4인 정규분포로부터 1000개의 랜덤샘플은 rnorm함수를 사용해요!
hist(histogram) : 히스토그램
hist의 옵션에 probability = T옵션이 있는데 T를하면 y축이 density로 바뀝니다!!
오늘은 확률분포에 대해 포스팅해보았어요!
궁금한거 있으시면 댓글 달아주세요!
(회기역 근처에서 R 기초 과외하고 있으니 관심 있으신 분은 jwj4519@naver.com 또는 jwj4519(카톡 ID)로
연락주세요^^)
그럼 다음 시간에는 다른 분포의 함수로 돌아오겠습니다!
좋은하루 보내세요~
댓글