본문 바로가기

분류 전체보기112

R언어 기초 Chapter 15 - 정규표현식 &Text 안녕하세요 푸디헬스입니다. 오늘은 웹크롤링에 쓰이는 정규표현식 Text의 기초 함수에 대해 알려드릴게요!!> 2019. 8. 5.
R언어 기초 Chapter 14 - function(), while() : R Language 안녕하세요 푸디헬스입니다. 오늘은 function()과 while()의 기초에 대해 알아보도록 하겠습니다. function은 함수를 작성할 때 사용되는 코드입니다 함수의 작성 출력 데이터가 객체 하나인 경우 abs() : 수학에서 쓰이는 절댓값 의미 출력 데이터가 여러 가지인 경우 결괏값 return( list(v1 = v1, v2 = v2)) 결괏값이 list형식으로 반환됩니다 예제 : 행렬의 열의 평균을 구하는 함수를 코딩해 보자 행렬(Matrix)의 열 평균 구하는 함수 : colMeans() != : 같지 않으면 if(class(x)!= 'matrix') break ---> x의 클래스가 행렬(matrix)이 아니면 break(멈춰라) v = rep(0, ncol(x)) ---> x의 열의 개수만.. 2019. 8. 4.
R언어 기초 Chapter 13 - 베르누이 분포, 이항분포, 포아송 분포, 표본 분포 안녕하세요 푸디헬스입니다 오늘은 그 외 나머지 분포에 대해 포스팅하겠습니다. 베르누이 : Bernoulli 이항 분포 : binominal distribution type = 'h' : histogram과 같은 형태로 lwd(line width : 선 굵기) = 3 x : 1000개 난수 생성 z : 정규화(표준화) 포아송 분포 포아송 확률변수 단위 시간(공간)에서 발생하는 사건의 발생 횟수 시행 횟수 n에는 제약을 두지 않음(관심이 없음) : n -> infinity (대체적으로) 사건이 발생한 확률 p가 아주 작은 경우에 사용됨 : p ->0 표본 분포 이를 확인하기 위한 모의실험을 위한 코딩은 a = c() : 빈 벡터 공간을 생성 barX : x의 평균 hat.sigma = x의 표준편차 a = .. 2019. 8. 4.
R언어 기초 Chapter 12 - 균등분포, t분포 안녕하세요 푸디헬스입니다 오늘은 균등 분포와 t분포에 대해 포스팅해보겠습니다. 균등 분포 확률 밀도 함수와 누적 분포 함수 a = 0, b = 1인 지수로부터 n = 1000개의 랜덤 샘플은 다음의 코딩으로 얻을 수 있어요 t 분포 확률 밀도 함수와 누적 분포 함수 자유도가 커지면 t분포는 정규분포에 수렴(자유도가 커진다는 의미는 표본크기가 커진다는 의미) 두 집단의 차이를 확인할 때 주로 사용하는 방법 t-test에 사용됨 자유도(df : degrees of freedom)에 따라 모양이 변함 자유도는 보통 표본집단이 1개일 때 df = n - 1 자유도의 이해를 돕기 위해 n= 4인 표본에서 평균이 3이라고 가정해볼게요 3개의 값이 정해지면 나머지 하나의 값은 평균 3을 맞추기 위해 정해져야 해요 3.. 2019. 8. 3.