[Must Learning with R_4] Ch5. 기본문법 4단계 연습문제

less than 1 minute read

Wikidocs에 올라와있는 Must Learning with R 을 참고하며 방학동안 부족한 R programming 공부를 하고있습니다. 책에 나와있는 연습문제를 정리하려 합니다.

Ch5. 기본문법 4단계

연습문제1

IMDB 데이터 셋의 Revenue Millions 변수에 존재하는 결측치를 모두 0으로 전환시켜 Revenue_NonNA라는 변수를 만드시오.

IMDB = read.csv("D:\\IMDB-Movie-Data.csv")

IMDB$Revenue_NonNA = IMDB$Revenue..Millions. 
#Rawdatat를 새로운 변수에 복사

IMDB$Revenue_NonNA[is.na(IMDB$Revenue_NonNA)] = 0 
#결측치 대체체

sum(is.na(IMDB$Revenue_NonNA)) 
#Revenue_NonNA 변수 내에서 결측치 갯수

결과

> IMDB$Revenue_NonNA = IMDB$Revenue..Millions. #Rawdatat를 새로운 변수에 복사
> 
> IMDB$Revenue_NonNA[is.na(IMDB$Revenue_NonNA)] = 0 #결측치 대체체
> 
> sum(is.na(IMDB$Revenue_NonNA)) #Revenue_NonNA 변수 내에서 결측치 갯수
[1] 0



연습문제2

Revenue..Millions. 의 이상치범위를 계산해보세요

# 1분위수 계산
Q1 = quantile(IMDB$Revenue..Millions.,probs = c(0.25),na.rm = TRUE) 
# 3분위수 계산
Q3 = quantile(IMDB$Revenue..Millions.,probs = c(0.75),na.rm = TRUE)

LC = Q1 - 1.5 * (Q3 - Q1) # 아래 울타리
UC = Q3 + 1.5 * (Q3 - Q1) # 위 울타리

cat(LC,UC) #이상치범위

결과

> # 1분위수 계산
> Q1 = quantile(IMDB$Revenue..Millions.,probs = c(0.25),na.rm = TRUE) 
> # 3분위수 계산
> Q3 = quantile(IMDB$Revenue..Millions.,probs = c(0.75),na.rm = TRUE)
> 
> LC = Q1 - 1.5 * (Q3 - Q1) # 아래 울타리
> UC = Q3 + 1.5 * (Q3 - Q1) # 위 울타리
> 
> cat(LC,UC) #이상치범위
-137.3975 264.3825