스토리

국내 이혼율 50%? 통계의 진실을 밝히다

<KISTI의 과학향기> 제1684호   2012년 09월 03일
매년 9월 1일은 통계의 날이다. 통계의 중요성을 홍보하기 위해 제정된 날로, 통계는 이미 과학 분야는 물론 정치, 경제, 사회, 문화 등 각종 분야에서 중요한 자료로 사용되고 있다. 하지만 통계는 변수에 따라 그 값이 크게 달라질 수 있고 자칫 조그마한 실수로 오류가 나기 쉬운 분야다. 통계적 분석을 할 때는 표본을 어떻게 수집하느냐에 따라 결론이 달라지기도 한다.

“여성들이여, 그대들의 남편을 조심하라. 살해당한 모든 여성의 절반은 자신의 남편이나 애인에 의해 희생당했다.” - <런던타임즈>
이 글은 살해당한 여성들의 가해자를 통계자료로 분석한 결과, 절반 이상이 자신의 남편이나 애인에 의해 살해당했다는 수치를 보고 보도된 기사다. 때문에 모르는 사람보다 사랑하는 사람이 당신을 살해할 가능성이 더 높다고 결론을 내고 있다. 하지만 이는 숫자만 보고 판단한 대표적인 통계의 오류다.

남편이나 애인이 있는 여성들은 이들과 보내는 시간이 타인과 보내는 시간보다 많은 편이다. 밤보다 낮에 교통사고가 더 많이 발생하는 이유와 비슷하다. 통계 자료 수치를 보면 밤 시간에 일어난 교통사고보다 낮 시간에 일어난 교통사고가 더 많다. 이 역시 단순 비교를 통해 통계를 해석했을 때 발생하는 오류로 볼 수 있다. 낮 시간의 교통사고가 상대적으로 많은 까닭은 밤 시간보다 낮 시간에 운전하는 사람들이 더 많기 때문이다.

국내 이혼율에서도 대표적인 통계의 오류를 찾을 수 있다. 2002년 국내 이혼율이 47.4%를 기록했다는 통계자료가 발표돼 논란이 일었다. 이 수치대로라면 국내 부부 두 쌍 중 한 쌍이 이혼을 한다는 뜻이다. 하지만 이는 곧 통계 오류임이 밝혀졌다. 특정 연도에 이혼한 부부의 수를 동일한 연도에 결혼한 부부의 수로 단순히 나눈 수치였던 것이다. 결혼한 부부의 수는 특정 연도에만 해당하지만, 이혼한 부부의 수는 그 이전에 결혼한 경우가 대부분이다. 이를 간과하고 특정 연도만 따질 경우, 결혼한 부부보다 이혼한 부부가 더 많을 수 있어 결혼이 적은 해는 이혼율이 100% 이상이 될 수도 있다.

이런 ‘통계의 오류’라는 허점을 이용해 통계 결과를 의도적으로 조작하기도 한다. 정부예산이나 기업실적, 경제전망 등은 기간과 변수를 어떻게 설정하느냐에 따라 전혀 다른 결과를 이끌어낼 수 있다. 선거를 앞둔 정치인의 지지율은 조사방법과 표본 설정, 질문 내용에 따라 10%에서 90%까지 끌어낼 수 있다.

대통령 선거를 앞두고 전화 설문 조사를 통해 각 후보들의 지지도를 산출하는데, 여기에도 오류가 숨어있다. 전화를 받는 사람은 자신이 좋아하는 후보를 말하지만, 정작 전화를 받은 사람들의 투표율은 100%가 아니다. 오히려 투표를 하지 않는 경우가 더 많기도 하다.

통계 오류로 인해 돌이킬 수 없는 사건이 발생하기도 했다. 1986년 1월 28일 미국 우주왕복선 챌린저호가 발사된 지 73초 만에 폭발해 우주비행사 7명이 전원 숨지는 사고가 발생했다. 이 처참한 광경은 TV를 통해 전 세계로 생중계돼 많은 사람들이 큰 충격을 받았다. 폭발 사고의 진상을 밝히던 조사팀은 발사할 때 사용되는 고체로켓 모터의 접합부위에 이상이 있음을 발견했는데, 이 사건 뒤에는 ‘표본 선택 편의’라는 통계적 오류가 숨겨져 있었다. ‘표본 선택 편의’는 전체를 아우르지 못하는 표본을 선정해 발생하는 잘못된 결과를 가리키는 통계학 용어다.

챌린저호 발사 전날 밤, 일부 관계자들은 고체로켓 모터의 접합부위를 염려해 우주왕복선 발사를 연기해야 한다고 주장했다. 우주왕복선이 이륙하기 위해서는 두 개의 고체로켓 모터가 필요한데, 로켓 모터를 각각 네 부분으로 분해해 케네디우주센터로 옮긴 뒤 다시 조립해 로켓 동체에 연결했다. 발사 당일의 기온은 섭씨 영하 0.56도로, 과거 기록상 최저 기온이었던 11.7도보다 12도 이상 낮았다. 일부 관계자들은 낮은 온도로 인해 로켓 모터와 동체의 접합에 이상이 발생할지 모른다고 우려했다. 실제 1985년 1월 24일에 발사된 우주왕복선 자료를 근거로 자신들의 주장을 뒷받침했다. 과거 기록상 최저 기온(11.7℃)이었던 이날의 발사는 비록 성공적이었지만 기록상 가장 많은 3곳에서 접합 이상이 발견됐던 것이다.

반면 발사를 강행하자고 주장한 사람들은 과거에 발견된 접합 이상의 수와 기온을 나타낸 그래프를 제시했다. 하지만 이 그래프는 기온과 접합 이상 사이의 관계를 명확하게 보여주지 못했다. 특히 문제가 되는 1985년 1월 24일의 발사 자료를 빼고 본다면 오히려 기온이 낮을수록 접합 이상은 감소하는 것처럼 보였다. 결국 발사를 강행하기로 결론을 내렸다.

알고 보니 논쟁에 참여한 이들은 접합 이상이 전혀 발견되지 않았던 발사자료를 포함하지 않았다. 이 자료를 포함해 접합 이상의 수와 기온의 관계를 그래프로 나타내면 명확한 추세를 발견할 수 있다. 즉 온도가 낮아지면 접합이상이 증가한다는 상관관계가 나타나는 것이다. 이를 간과하지 않았다면 처참한 사고를 막을 수 있었을 것이다.

이제까지 다양한 통계의 오류들을 살펴봤다. 하지만 여기서 정확히 짚고 넘어가야 할 사실은 통계가 잘못된 것이 아니라 통계를 해석하는 과정이 잘못된 것이라는 점이다. 누구나 오류를 범할 수 있지만, 의도적인 조작을 통해 통계의 결과를 바꾸는 경우는 지양해야 할 것이다. 또 기간과 변수, 표본 설정 등을 정확히 하고 문항에 맞는 세부 요소들을 고려해 통계를 산출해야 할 것이다.

글 : 심우 과학칼럼니스트
평가하기
김동환
  • 평점   별 5점

정확한 통계란 힘들기때문에 믿을수 없고 믿기에는 잘못된 정보를 전해줄 수 있어 항상 세심하게 따져봐야 할 것 같습니다.

2012-11-13

답글 0

음..
  • 평점   별 5점

과학향기 보고 댓글볼때마다 아.. 그래도 여기는 사람들이 다 예의바르게 쓰고 가는구나 했는데.
꼭 그것만은 아니군요. 미꾸라지들! 어지럽하지 맙시다!

2012-09-13

답글 0

지나가다
  • 평점   별 5점

이게 통계의 오류라니까요.. 평균적으로 매년 100쌍이 결혼해오고 매년 10쌍이 이혼을 해왔다고 한다면 평균이혼률은 10%정도일겁니다.
그런데 올해 유난히 결혼을 안해서 20쌍만 결혼을 했다면, 이혼률은 50%가 되는겁니다.
이 20쌍은 통계에 의하면 나중에 언젠가 2쌍이 이혼을 하겠죠. 그렇다면 이혼률 50%는 설득력이 없다는 것입니다.

2012-09-11

답글 0

기준
  • 평점   별 5점

현상은 명확한데 이를 수치화 하는 과정에서 오류가 발생하죠.
지적처럼 고의로 어긋난 조건이나 또는 일부를 편취하여 자기에게 유리한 통계결과를 내기도 하구요.

2012-09-11

답글 0

김갑태
  • 평점   별 5점

박근혜 지지율 50%믿지 마세요 조사방식에 따라 60%지지율도 가능합니다 응답율 5%,10%짜리 여론 조사입니다 참고로 대선 여론 조사는 오마이뉴스 방식이 가장 정확하다고 하네요 - by 시인 임효림

방금 본 Twit입니다. 전공이 아니지만 속지 않으려면 통계공부해야겠네요. ㅎㅎ

2012-09-04

답글 0

한겨리
  • 평점   별 5점

잘 읽었습니다. 수많은 과학자들조차 실수를 하는군요.

2012-09-04

답글 0

음...
  • 평점   별 5점

김진수님의 말이 맞는듯..물론 결혼한 부부가 많다는 건 알지만 통계적 해석은 그해 결혼한 사람은 결국 나중이라도 그 중의 50%는 이혼한다는 의미가 되는것 같습니다.

2012-09-04

답글 0

asd
  • 평점   별 5점

이미 결혼해서 가정을 이룬 부부의 수는 1년에 결혼하는 부부보다는 훨씬 많을겁니다. 이혼 발생률이 년당 x%라고 하면, 이건 전체 가정 숫자에 곱해야 년당 이혼 부부의 숫자가 나오죠.

2012-09-04

답글 0

아둔이
  • 평점   별 5점

좋은 글 시원한 내용 잘 읽었습니다. 저 같은 바보도 정치판은 언론플레이의 장이요 이를 위한 통계 조작은 필수임을 알고 있는데 이에 부화뇌동하여 서로 손가락질 하니 참으로 한심하기 짝이 없군요. 여러분이 바로 당쟁의 주역인 정치인들의 확성기군요. 꼭 과학향기 게시판에서까지 이래야 하는지?

2012-09-03

답글 0

지적
  • 평점   별 1점

영우야,아무리 사회 부적응자일지언정 한글은 제대로 쓰자...세종대왕님께 창피하다.

2012-09-03

답글 0

영우
  • 평점   별 5점

옳은이님 같은 언론왜곡과 온갖 꼼수의 집합인 외곡된 수고꼴이 통계 오류와 혼란에 대해 얘기 하다니 헛웃음만 나오는군요.. 하하

2012-09-03

답글 0

김진수
  • 평점   별 5점

일년 간의 이혼 건수가 일년 간의 결혼 건수의 반이라면, 결혼한 사람들의 반이 언젠가는 이혼한다고 봐도 되는 것 아닐까요? 혼인관계 지속년수가 얼마가 되든 말이지요. 실제로 이혼율이 늘어나는 추세라면 올해 결혼한 사람들의 이혼가능성은 50%를 넘을 거라고 예측할 수 있지 않을까요?

2012-09-03

답글 0

옳은이
  • 평점   별 5점

통계의 필요성과 오류에 대해 상당히 명확하게 분석 했군요.
이런 통계의 오류를 깨닫는다면 맨날 간만보는 간철수나 뜬구름 잡고있는 문재인이 같은자들이 잠잠해 질텐데요^^
통진당 쓰레기들도 어줍잖은 통계를 이용해서 대한민국을 혼란시키고 종북사상을 퍼트리려 안달을 하고있죠.
한걸레나 개마이같은 종북세력이 설치고 있는건 뇌물현 시체놀이가 통계적으로 아직도 유효하다는 반증일겁니다...
종북,좌빨,사회불만및 사회 부적응자들같은 쓰레기들 집단에서 만들어지는 통계이긴 하지만...ㅉㅉㅉ

2012-09-03

답글 0

이태훈
  • 평점   별 5점

좋은 기사입니다. 박근혜의 지지율도 상당히 조작이 의심스럽죠^^ 그렇게 높을리가 없는데도.

2012-09-03

답글 0

윤승환
  • 평점   별 5점

좋은 글 감사드립니다...!

2012-09-03

답글 0

김상원
  • 평점   별 5점

이미리님 조건을 잘못 맞추셨습니다. 조중동 안보는 사람이라는 특정인물을 설정해놓으신게 첫번째 오류 두번째는 그분들이 박근혜 지지율 조사에도 응답하지 않으므로 라는 이미 결정을 내리셨네요 이런분은 통계오류가 아니라 그냥 통계에서 빼야하는 수입니다. 통계는 어찌되었던 통계가 가능한 수치로소 봐야하죠. 통계의 오류가 아닌 조건의 오류로 보입니다.

2012-09-03

답글 0

이미리
  • 평점   별 5점

요즘 주간 찌라시 보다도 못한 조중동 안보는 사람은 박근혜 지지율 조사에도 응답하지 않으므로 박근혜 지지율의 허상은 통계의 오류가 맞겠네요..

2012-09-03

답글 0

바른청년
  • 평점   별 5점

명쾌한 해답이시네요 ㅋㅋㅋ

2012-09-03

답글 0

그것은
  • 평점   별 5점

이태훈씨가 한겨례, 오마이만 보기 때문입니다. 역시 통계의 오류죠.

2012-09-03

답글 0

추천 콘텐츠
인기 스토리
쿠키를 지원하지 않는 브라우저이거나 브라우저 설정에서 쿠키를 사용하지 않음으로 설정되어 있는 경우 사이트의 일부 기능(로그인 등)을 이용할 수 없으니 유의해 주시기 바랍니다.
메일링 구독신청하기