평균을 얻어내는데 벡터로 저장한다.
이때 na는 NA를 의미하고 rm은 remove를 의미한다. 따라서 NA로 기록된 값들을 지움으로써 추후 총합 / 개수에서 개수에 영향을 주지 않게 한다.
> sapply(mtcars, mean, na.rm=TRUE)
mpg cyl disp hp drat wt
20.090625 6.187500 230.721875 146.687500 3.596563 3.217250
qsec vs am gear carb
17.848750 0.437500 0.406250 3.687500 2.812500
평균을 얻어내는데 벡터로 저장한다.
na.rm은 TRUE가 베이스가 되며 현재 mtcars에는 NA가 없기에 무시된다.
> sapply(mtcars, mean)
mpg cyl disp hp drat wt
20.090625 6.187500 230.721875 146.687500 3.596563 3.217250
qsec vs am gear carb
17.848750 0.437500 0.406250 3.687500 2.812500
summary를 이용하면 다양한 수학적 정보 확인 가능
> summary(mtcars)
mpg cyl disp hp
Min. :10.40 Min. :4.000 Min. : 71.1 Min. : 52.0
1st Qu.:15.43 1st Qu.:4.000 1st Qu.:120.8 1st Qu.: 96.5
Median :19.20 Median :6.000 Median :196.3 Median :123.0
Mean :20.09 Mean :6.188 Mean :230.7 Mean :146.7
3rd Qu.:22.80 3rd Qu.:8.000 3rd Qu.:326.0 3rd Qu.:180.0
Max. :33.90 Max. :8.000 Max. :472.0 Max. :335.0
drat wt qsec vs
Min. :2.760 Min. :1.513 Min. :14.50 Min. :0.0000
1st Qu.:3.080 1st Qu.:2.581 1st Qu.:16.89 1st Qu.:0.0000
Median :3.695 Median :3.325 Median :17.71 Median :0.0000
Mean :3.597 Mean :3.217 Mean :17.85 Mean :0.4375
3rd Qu.:3.920 3rd Qu.:3.610 3rd Qu.:18.90 3rd Qu.:1.0000
Max. :4.930 Max. :5.424 Max. :22.90 Max. :1.0000
am gear carb
Min. :0.0000 Min. :3.000 Min. :1.000
1st Qu.:0.0000 1st Qu.:3.000 1st Qu.:2.000
Median :0.0000 Median :4.000 Median :2.000
Mean :0.4062 Mean :3.688 Mean :2.812
3rd Qu.:1.0000 3rd Qu.:4.000 3rd Qu.:4.000
Max. :1.0000 Max. :5.000 Max. :8.000
표준편차 계산
> sapply(mtcars, sd)
mpg cyl disp hp drat
6.0269481 1.7859216 123.9386938 68.5628685 0.5346787
wt qsec vs am gear
0.9784574 1.7869432 0.5040161 0.4989909 0.7378041
carb
1.6152000
분산 계산
> sapply(mtcars, var)
mpg cyl disp hp drat
3.632410e+01 3.189516e+00 1.536080e+04 4.700867e+03 2.858814e-01
wt qsec vs am gear
9.573790e-01 3.193166e+00 2.540323e-01 2.489919e-01 5.443548e-01
carb
2.608871e+00
히스토그램을 표현한다.
> hist(mtcars$mpg)
freq = FALSE # area = 1이 들어가게 되면
> hist(mtcars$mpg, freq = FALSE) # area = 1
d에 mtcars의 밀도를 저장해주고
> d <- density(mtcars$mpg) # returns the density data
d를 콜해보면 다음과 같이 나타난다.
> d
Call:
density.default(x = mtcars$mpg)
Data: mtcars$mpg (32 obs.); Bandwidth 'bw' = 2.477
x y
Min. : 2.97 Min. :6.481e-05
1st Qu.:12.56 1st Qu.:5.461e-03
Median :22.15 Median :1.926e-02
Mean :22.15 Mean :2.604e-02
3rd Qu.:31.74 3rd Qu.:4.530e-02
Max. :41.33 Max. :6.795e-02
plot에 의해 플로우 차트로 만들어내고
> plot(d) # plots the results
polygon으로 색은 빨강, 경계선은 파란색으로 플로우차트를 채울 수 있게 된다.
> polygon(d, col="red", border="blue") # fill
히스토그램도 이러한 방법으로 색을 채울 수 있게 된다.
hist(AirPassengers,main="Histogram for Air Passengers",xlab="Passengers",border="blue", col="green",xlim=c(100,700),las=1,breaks=5)
'Basic > R' 카테고리의 다른 글
R언어 데이터 프레임 몇가지 예제 (0) | 2018.05.26 |
---|---|
R언어 예제를 통한 몇가지 정리 (0) | 2018.05.25 |
R언어 조건문, 반복문, 함수 (0) | 2018.05.13 |
R언어 Matrix, Array, Data frame (0) | 2018.04.05 |
Data Types, Lists, Attribute, name 함수 (0) | 2018.04.03 |