R을 이용한 데이터 분석 : 제동거리 예측하기

R을 이용한 데이터 분석 : 제동거리 예측하기

8월 27, 2014Datamining

R을 이용한 데이터 분석

제동거리 예측하기

안녕하세요.  서울시립대 데이터마이닝연구실입니다!  데이터마이닝하면 이름이 어려워서 어렵게 생각하는 분들도 계신데요, 데이터마이닝이란 간단히 data에서 정보와 지식을 발견하는 것을 말합니다.  즉, 가공되지 않은 data에서 가공을 하고, 분석을 해서 유용한 정보를 추출해내는 것을 말합니다.    그러면 이제 어떤 데이터들이 있고 이 때 어떤 분석 방법들을 이용해서 유용한 정보를 추출하는지 앞으로 블로그 페이지에서 소개하고자 합니다.  첫 포스팅은 속력과 제동거리가 담긴 데이터로 차량의 제동거리를 예측하는 것에 대한 내용입니다.

제동거리차량이 제동을 건 지점부터 완전히 멈춘지점까지의 거리입니다.  속력과 제동거리 간의 상관관계가 있는지 분석을 해서 달리던 차량이 멈췄을 때의 제동거리를 예측해보겠습니다!  이 문제는 기존의 측정 데이터를 바탕으로 모델을 만들면, 일정한 속력으로 가는 차량이 멈췄을 때의 제동거리가 어떤지 예측할 수가 있습니다.

 데이터 모델 만들기

데이터는 R에서 제공하는 ‘cars’데이터를 이용했습니다.  ‘cars’데이터는 speed와 dist를 속성으로 담고 있고, 총 2개의  속성과 50개의 row로 이루어져 있습니다.

  • speed : 차량속력 (단위 : mph), dist : 제동거리 (단위 : ft)
  • ex) speed : 4, dist : 2 → 4 mph로 주행하는 차량이 급정지 하였을 때 거리가 2 ft이다.

 Predictive

예측은 어떤 변수들을 이용해서 다른 변수의 값을 추론하는 것을 말합니다.  이런 예측 방법에는 여러가지가 있는데 분류(classification), 회귀(regression), 이상치 탐색(Deviation Detection) 등이 있습니다.  우리는 이러한 여러 예측 분석 방법 중 회귀분석 방법을 이용해서 모형을 만들고 어느 특정한 값에 대해서 어떤 결과가 나오게 되는지 예측하고자 합니다.  회귀분석을 이용하면 모델에 대한 회귀식을 얻을 수 있습니다.

회귀분석 : 변수들 간의 함수관계를 분석하는 방법 중의 하나로, 독립변수가 종속변수에 미치는 영향력의 크기를 파악하고, 이를 통하여 독립변수의 일정한 값에 종속 변수 값을 예측하는 모형을 산출하는 방법


Call: lm(formula = dist ~ speed, data = cars)

Residuals:

Min 1Q Median 3Q Max -29.069 -9.525 -2.272 9.215 43.201

Coefficients: Estimate Std.           Error            t value          Pr(>|t|)

(Intercept)      -17.5791          6.7584           -2.601          0.0123    *

speed                 3.9324          0.4155            9.464        1.49e-12    ***

— Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 15.38 on 48 degrees of freedom Multiple R-squared: 0.6511,

Adjusted R-squared: 0.6438 F-statistic: 89.57 on 1 and 48 DF, p-value: 1.49e-12


 

위의 수행 결과로 cars데이터에 대한 회귀식을 얻을 수 있습니다.  회귀식과 데이터를 합쳐서 눈에 보기 쉽게 그래프로 표현하면 아래와 같습니다.

  •  cars데이터에 대한 회귀식 : y=3.932x-17.5791

Rplot
Rplot02

 

이제, 회귀식을 토대로 제동거리를 예측 해보자!

  • speed가 30(mph)일 때 제동거리 : 100.3809(ft)
  • speed가 50(mph)일 때 제동거리 : 179.0209(ft)

댓글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다.

다음의 HTML 태그와 속성을 사용할 수 있습니다: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">