본문 바로가기

데이터분석/R

(4)
[R]가설검정과 예제로 보는 1집단 t-test, paired t-test, 2집단 t-test 결과 해석, t.test() in r 1. 가설검정(hypothesis test)의 단계 2. 1집단 t-검정(one sample t-test) + 예제 3. paired t-test(짝진 표본 t검정) + 예제 4. 2집단 t-검정(two sample t-test) + 예제 1. 가설검정(hypothesis test)의 단계 가설검정은 다음의 5단계로 진행됩니다. 통계 분석 프로그램인 r을 이용하면 3, 4번의 과정을 자동으로 계산해줍니다. 1. 가설(hypothesis)을 세운다 2. 유의수준(significance level) alpha를 정한다. (보통 0.05) 3. 검정통계량(test statestic)을 구한다. 4. 기각역(critical region, rejection regeion)을 구하여 검정 통계량과 비교한다. 5. ..
[R 기초]vector, list의 슬라이싱, 원소 추가, 수정, 제거 등 in r 1. 벡터 c() 2. 리스트 list() 3. 1차원 자료의 슬라이싱(slicing) 4. 2차원 자료의 슬라이싱 5. 원소 추가(삽입) 6. 원소 수정(변경)+전처리 7. 원소 제거(삭제) 1. 벡터 c() c()에 원소들을 넣어 벡터를 만들 수 있습니다. 벡터의 원소로 문자열, 숫자, 변수, 논리값 등이 가능하지만 각 원소의 형태들이 같아야 합니다. > num cat("벡터의 길이:", length(num)) 벡터의 길이: 3 벡터의 원소가 모두 문자열 형태인 경우 class는 문자열, 원소가 모두 숫자인 경우 숫자로 인식합니다. 그러나 여러가지 형태의 원소들을 동시에 가질 경우 문자열이 아닌 원소도 모두 문자 형태로 인식합니다. > class(num);class(c(1,2,3)) [1] "char..
[R 기초]print 관련 정리(print, paste, cat, sprintf 함수) in r 1. 하나의 변수 출력하기 - print() 2. 2개 이상의 변수 출력하기 - paste(), cat() 3. 문자열 사이에 여러 형태의 값 넣어서 출력하기 - sprintf() 4. list를 table 형태로 출력하기 - unlist(), as.data.frame() 1. 하나의 변수 출력하기 - print() print() 함수에 하나의 변수를 넣으면 그 변수를 출력해주지만, 2개 이상의 변수를 넣으면 오류가 뜹니다. > num print(num) [1] 3.14 > print("변수 num의 type: ", typeof(num)) Error in print.default("변수 num의 type: ", typeof(num)) : invalid printing digits -2147483648 I..
[R 기초]데이터 불러오기, 기술통계(평균, 빈도표, box plot과 해석, histogram) in r 1. 외부 데이터 불러오기 2. R에 내장된 데이터 3. 기술통계 4. Box plot(상자도표, 상자그림)과 해석 5. Histogram(히스토그램) 1. 외부 데이터 불러오기 데이터 파일을 불러옵니다. txt 파일과 dat 파일은 read.table() 함수를, 엑셀을 이용한 csv 파일은 read.csv() 함수를 사용합니다. 이때 파일 경로는 \\(역슬래시 2번) 또는 /로 구분합니다. read.table("파일 경로") read.csv("파일 경로") csv 파일을 불러와 dat이라는 변수에 저장합니다. 데이터 파일의 1행이 변수명인 경우 header=TRUE로 주면 1행을 열 이름으로, 2행부터 데이터의 1행으로 가져옵니다. 변수명이 없는 파일의 경우 header=F로 가져옵니다. 만약 데이터..