통계는 자료의 하나일 뿐 무조건적 신뢰 금물
기초 자료·해석 등의 오류 의심할 필요 있어 
일반인들도 ‘리터러시’ 등 통계 분석 교육을  

 

정건용 JnP 경영발전연구소 소장

통계학이라는 학문이 있다. 통계학이란 ‘사회현상을 통계에 의해 관찰, 연구하는 학문으로 수학의 한 분야다’라고 국어사전에 등재돼 있다. 어떤 사람들이 수학의 한 분야인 통계는 학자들이나 다루는 분야라고 생각하겠지만, 통계라는 단어는 이미 우리 일상생활 속 깊숙이 자리 잡고 있으며 어떤 때는 통계가 이 세상을 지배하고 있다는 느낌마저 든다.

문제는 ‘통계는 늘 가정을 가지고 출발하며, 그 가정이 무너질 때 엄청난 오류를 범할 수 있다’는 사실을 대중들이 잘 모르고 접근한다는 것이다. 단순히 모르는 정도면 문제가 되지 않겠지만 잘못된 통계가 우리 생활을 전혀 다른 방향으로 끌고 갈 수 있다는 점에서 이 부분은 극복돼야 할 문제다.

최근 한 국회의원이 2016년 말 기준으로 서울 주택 중위권 가격을 4억 3,485만원으로 공표한 적 있었다. 서울 주택의 중위권 가격이 세계 주요 대도시와 엇비슷하며, 집값이 비싸기로 유명한 일본 도쿄의 3억1,136만원보다 훨씬 비싸고 미국 뉴욕의 4억 4,340만원과 비슷한 수준이라는 것이었다.

이 발표가 기사화되면서 한국의 수도인 서울의 집값이 가히 살인적이라는 인식이 퍼지고, 이같은 보도를 본 젊은이들이 ‘헬조선’을 외치는 하나의 변수로 작용하고 있다.

우리는 활자화, 명문화된 문서를 신뢰하는 경향이 있다. 앞서 제시한 사례의 기본 가정에 문제가 있음에도 불구하고 신뢰하지 않을 근거는 적어 보인다. 문제는 이 통계의 기본 가정이 유사한 지역이 아니라는데 있다. 

도쿄의 경우는 읍면지역을 포함하고 있으며, 뉴욕의 경우도 뉴욕을 중심으로 뉴저지주, 펜실베이아주 등 농촌지역을 포함한 가격을 단순 대비한 것이다. 도심 중심인 서울의 집값과 농촌지역을 포함한 집값의 평균값의 대비가 과연 정확한 정보인가 하는 문제가 발생된다.

이 자료는 통계의 오류를 전형적으로 보여주는 사례 중 하나이다. 최근 각종 보도와 정책의 기초가 되는 많은 통계가 쉼 없이 나오고 있다. 이런 통계의 오류들을 통계 전문가가 아닌 일반인이 어떻게 극복할 것인가 하는 문제를 생각해 봐야할 시점이 지금이다.

통계 비전문가도 통계 결과의 해석에 오류를 범하지 않을 방법은 있다. 통계의 기초 자료가 어떤 것인가를 살펴보는 것이 하나의 방법이다. 다행스러운 것은 최근에 많은 언론이 통계의 기본인 표본 등을 공개하고 있다는 점이다. 표본만 잘 살펴봐도 비전문가도 해석함에 있어 오류를 줄일 수 있다.

다음은 평균에 대한 해석의 오류다. 우리는 평균 얼마라고 하면 그 평균값에 자신의 경험치를 비교하는 경향이 있다. 하지만 평균값을 낼 때 특이치를 감안했는가 하는 점을 의심해 볼 필요도 있다. 표본이나 모집단의 숫자가 적을 경우 특이치가 결과 값에 미치는 영향이 크기 때문이다.

통계의 오류를 극복하기 위해서는 통계 리터러시가 필요하다. 리터러시는 문자화된 기록물을 통해 지식과 정보를 획득하고 이해할 수 있는 능력을 말하며, 현대인은 확률이나 데이터를 이해할 수 있어야 한다. 

통계는 하나의 자료일 뿐이다. 통계 그 자체가 사실을 대변할 수는 없다는 것을 인정해야 한다. 오히려 주장하는 바를 검증하기 위해 통계가 사용돼야 한다. 문제는 우리의 통계적 사고 수준이 마치 초등학교부터 고등학교까지 12년이나 배운 영어를 능숙하게 활용하지 못하는 것과 같다는 것이다.

모든 사람이 통계 전문가가 될 필요는 없지만 통계를 이해하고 활용하는 능력은 교육돼야 한다. 이제 더 이상 통계만을 가지고 국민들을 이용하려고 해선 안 된다. 어떤 주장을 함에 있어 이런 통계가 있다는 입증의 자료, 또는 현상을 분석하면서 통계의 모집단과 표본, 통계방법 등을 공개하는 사회적 분위기 조정이 필요한 때가 지금이 아닌가 생각해 본다. 

저작권자 © 울산매일 - 울산최초, 최고의 조간신문 무단전재 및 재배포 금지