RMSE(Root Mean Square Error) Mathematics

RMSE(Root Mean Square Error)

말 그대로 풀이하면 실험이나 관측에서 나타나는 오차(Error)를 제곱(Square)해서 평균(Mean)한 값의 제곱근(Root)을 뜻합니다.
공식으로 쓰면

RMSE = root{(e1+ e2+ … + en)/(n - 1)}

입니다.
공식의 모양을 보고 짐작할 수 있듯이 이 개념은 통계학의 표준편차와 유사합니다.
평균을 낼 때 n이 아닌 n - 1로 나누는 것이 의아할지도 모르겠는데, 통계학에서 (어떤 거대한 모집단이 있다고 가정하고) 표본표준편차를 낼 때 모집단의 표준편차를 낼 때와 똑같이 n으로 나누면 표본표준편차를 통해서 모집단의 표준편차를 추정할 때 너무 작은 값으로 추정하게 되는 경향이 있어서 표본표준편차는 n이 아닌 n - 1로 나누곤 합니다.

일반적으로 RMS는 RMSE(Root Mean Square Error)라고 하지요. 즉 평균 제곱근오차라고 합니다.
어떤 관측치에 대해서 유일한 참값을 알고 싶으나 관측을 반복하여도 참값을 얻을 수 없게 됩니다. 따라서 오차론이라는 학문이 대두 되었지요.
잉여 관측을 통해서 참값을 구할 수는 없으나 참값에 가까운 값을 구할 수 있는데 이를 최학치(most probable value)라고 합니다.
이를 식으로 표현하면,
      참값 - 관측값 = 참오차
      최학치 - 관측값 = 잔차
라고 하지요. 어떤 관측을 n번 관측하여 그 양을 l1, l2, ..., ln이라고 하면 그 평균값은 x=(l1+l2+...+ln)/n이라고 합니다.
잔차의 제곱을 산술평균한 값의 제곱근을 평균제곱근오차(RMSE)라 하며 RMSE는 표준편차(standard deviation)와 같은 의미로 사용됩니다. 또한 독립관측의 경우에는 분산의 제곱근을 의미하지요.

즉, 표준편차(또는 평균제곱근오차)는 관측값들간의 상호간 편차를 의미하게 되며, 일반적으로 측량에서는 조정값(또는 최확치)으로부터의 오차를 다루게 되는데 이 때의 오차를 표준오차라고 합니다. 표준편차는 독립관측값의 정밀도를 의미하고 표준오차는 조정값의 정밀도를 의미하므로 표준편차와 표준오차는 넓은 의미에서 같이 사용되고 있습니다.

또한, RMSE나 STD가 좋다는 것은 정밀도가 좋다는 의미도 된답니다.

 

출처 : http://www.cyworld.com/iamwill/3310570


덧글

댓글 입력 영역