[Must Learning with R_4] Ch5. 기본문법 4단계 연습문제
Wikidocs에 올라와있는 Must Learning with R 을 참고하며 방학동안 부족한 R programming 공부를 하고있습니다. 책에 나와있는 연습문제를 정리하려 합니다.
Ch5. 기본문법 4단계
연습문제1
IMDB 데이터 셋의 Revenue Millions 변수에 존재하는 결측치를 모두 0으로 전환시켜 Revenue_NonNA라는 변수를 만드시오.
IMDB = read.csv("D:\\IMDB-Movie-Data.csv")
IMDB$Revenue_NonNA = IMDB$Revenue..Millions.
#Rawdatat를 새로운 변수에 복사
IMDB$Revenue_NonNA[is.na(IMDB$Revenue_NonNA)] = 0
#결측치 대체체
sum(is.na(IMDB$Revenue_NonNA))
#Revenue_NonNA 변수 내에서 결측치 갯수
결과
> IMDB$Revenue_NonNA = IMDB$Revenue..Millions. #Rawdatat를 새로운 변수에 복사
>
> IMDB$Revenue_NonNA[is.na(IMDB$Revenue_NonNA)] = 0 #결측치 대체체
>
> sum(is.na(IMDB$Revenue_NonNA)) #Revenue_NonNA 변수 내에서 결측치 갯수
[1] 0
연습문제2
Revenue..Millions. 의 이상치범위를 계산해보세요
# 1분위수 계산
Q1 = quantile(IMDB$Revenue..Millions.,probs = c(0.25),na.rm = TRUE)
# 3분위수 계산
Q3 = quantile(IMDB$Revenue..Millions.,probs = c(0.75),na.rm = TRUE)
LC = Q1 - 1.5 * (Q3 - Q1) # 아래 울타리
UC = Q3 + 1.5 * (Q3 - Q1) # 위 울타리
cat(LC,UC) #이상치범위
결과
> # 1분위수 계산
> Q1 = quantile(IMDB$Revenue..Millions.,probs = c(0.25),na.rm = TRUE)
> # 3분위수 계산
> Q3 = quantile(IMDB$Revenue..Millions.,probs = c(0.75),na.rm = TRUE)
>
> LC = Q1 - 1.5 * (Q3 - Q1) # 아래 울타리
> UC = Q3 + 1.5 * (Q3 - Q1) # 위 울타리
>
> cat(LC,UC) #이상치범위
-137.3975 264.3825