노무현 대통령 배너

통계의 신뢰성

중얼중얼 혼자놀기 | 2008/06/15 17:26 | iamback :: 인쇄
통계는 어디까지 신뢰할수 있을까?
표본의 신뢰성 부분은 넘어가도록하자... 난 통계전문가가 아니므로 ㅎㅎ
내가 이야기 하고 싶은것은 통계의 제목 또는 질의 부분인데..
이부분을 어떻게 하느냐에 따라서 같은 조사를 전혀 다른 방향으로 만들어버릴수 있다.
무슨이야기냐하면,,, 다음 예를 보면 이해가 좀더 쉬울듯하다..

만약에 누가 축구와 건강에 관한 조사를 한다고 하자...

유명한 리그인 분데스리가 선수들중
현재까지 생존해있는 사람들이 80세 이상이 없다.
축구를 하는 사람들중 80세 이상 장수하는 사람이 없다
고로 축구를 하는것은 장수에 도움이 되지 않는다
라는 결론을 누가 냈다고 치자
이 조사 내용은 당연한 것으로 분데스리가가 1963년에 시작되었으니
63년당시 리그에 최고령선수가 35세 선수였다고 치고, 현재까지 그선수가 살아있으면 80세...
그이상나이가 있을수가 없다.

이해가 가는가?

분데스리가는 그래도 오래된 리그니까 k리그로 예를 바꿔보면 더 이해가 갈지도...
k리그는 1983 년부터 대회가 열리고 있다. 25년 된리그이다.
83년 리그 출범당시 최고령 선수가 40세라고 치자.
그선수가 현재까지 살아있다면 나이가 65세...
k리그 출신 선수중 66세 이상 되는 사람은 없다.
축구를 하면 장수할수 없다.

이해가 되시는가?
위의 통계결과(분홍색) 가 도출되기까지의 조건들을 싹 뺴고,
통계결과를 가지고 살짝 비틀어서 말하면 파란색부분이 된다.

'축구를 하면 장수할수 없다.'

앞으로 통계를 근거로 주장하는 내용들을 조심히, 찬찬히 뜯어보아야할것같다.

이런 경우도 있다.

5월 28일자 뉴스 위크 한국판 에 실린 '악마에게 양심을 파는 과학자들' 이란 제하의 기사인데
기업에 고용되어 통계내용을 희석하고 기업들에게 유리한 '과학적 근거들'을 만들어주는
과학자, 또는 그런일을 전문적으로 하는 회사 에 대한 내용이다.

그들이 하는일은 이렇다.
특정 물질의 암발병율을 낮추도록 주문을 받으면 그 물질에 노출되는 집단을 2~3년만 추적한다.
왜? 대부분 암 발병은 20~30 년이 걸리니까...
아니면, 데이터를 '희석' 하는 방법들도있다.
특정물질에 바로 노출되는 집단인 공장 근로자 의 데이터와
그 물질에 덜 노출되거나 거의 노출되지 않는 공장 관리자 또는 화이트칼라 집단의 데이터를
섞는것이다.
공장 근로자 100명당 80명이 발병하게 만드는 특정 물질이 있다고 하자 - 80%
공장 관리자와 화이트 칼라 집단은 발병율이 100명당 10명이다. - 10%
이 두집단의 데이터를 합치면 200명당 90명 발병이다.- 45%
어때 특정위험물질이 훨씬 안전해 보이지?

일반적으로 우리 일반인들이 어떤 통계결과를 볼때
신뢰하는 경향이 있는데...
저런 기사를 보면 잘 뜯어 봐야하겠다는 생각이 든다.
이럴때 언론의 역할이 중요한거겠지...




크리에이티브 커먼즈 라이센스
Creative Commons License

"중얼중얼 혼자놀기" 카테고리의 다른 글


이 글의 관련글
    이글의 태그와 관련된 글이 없습니다.
2008/06/15 17:26 2008/06/15 17:26

트랙백을 보내세요

트랙백 주소 :: http://pippen80.cafe24.com/trackback/91

댓글을 달아 주세요

  1. 情人 2008/06/19 12:38

    학문에는 그릇됨이 없는데...그걸 어떻게 사용하느냐에 따라서 너무 다른 결과가 나오는군요.
    무엇이든 악용하지 말아야 하고, 또한 그 것을 악용하지 않았는지 잘 살펴보아야 하겠군요.

    사실 이런 말이 필요없는게 바람직한데 말이죠

[로그인][오픈아이디란?]
비밀글 (Serect)
댓글 달기 (Submit)