옷도 못 사입을 정도로 헐벗는 경제?원래 숫자라는 건 생각보다 믿을 것이 못 됩니다. 뉴스에서 통계자료를 들먹이며 숫자와 그래프를 들이민다고 해도 그래프의 경우에는 보여주고 싶은 것을 크게 보여주고, 엇비슷한 결과가 나온 다른 것에 대해서는 한 마디도 안 하는 것이 당연합니다. 통계 숫자의 경우에는 말하려는 주제에서 벗어난 결과는 아예 보여주지도 않지요.
확률도 마찬가지라서 얼마나 정밀한가, 또 얼마나 많은 집단을 대상으로 했는가에 따라 결과가 천차만별로 달라져 버립니다.
아래는 열통계 교수님이 주신 프린트물인데 좀 복잡해 보이기는 해도 한번 읽어보시라고...
---------------------------------------------------------------------------
어떤 회사원이 정기검진을 받는 중에 이상 징후가 발견되어 정밀검사를 실시한 결과 에이즈에 걸렸다는 진단이 나왔다고 하자. 또한 이때의 정밀 검사 신뢰도가 99%라고 하자. 이 회사원은 자기가 에이즈에 걸렸을 확률이 99%라고 생각하고 인생을 포기하고 모든 것을 정리하기 시작했다. 과연 이 사람이 에이즈에 걸렸을 확률이 99%일까?
서울(인구 1000만)에서 에이즈 감염자가 1000명이라고 하자. 감염율은 1/10000, 즉 0.01%의 사람이 감염자이다.
서울사람 모두에게 위의 정밀검사를 실시했다면 에이즈에 걸리지 않은 9,999,000 명의 1%, 즉 99,990명이 에이즈 감염자로 잘못 판단될 수 있다. 왜냐하면 검사신뢰도가 99%이기 때문이다. 실제 에이즈 환자 1000명에게 검사를 실시하면 99%, 즉 990명이 에이즈 양성으로 진단된다. 결국 99,990+990=100,980명이 에이즈 양성반응자로 진단이 될 것이다. 여기서 실제 에이즈 감염자는 1000명에 불과하기 때문에 에이즈 양성 판정이 된 사람이 에이즈에 걸렸을 확률은 1000/100,980 = 0.0099, 즉 1%도 채 안된다. 그러므로 99%정밀도를 가진 1차 정밀검사에서 에이즈로 진단되었다 할지라도 진짜 에이즈일 확률은 99%가 아니라 1%라는 얘기다.
이 문제에서 검사신뢰도가 99.9%라 하고 다시 생각해 보자. 신뢰도가 이 정도로 좋은 검사는 드물다. 서울사람 모두에게 위의 정밀검사를 실시했다면 에이즈에 걸리지 않은 9,999,000 명의 0.1%, 즉 9999명이 에이즈 감염자로 잘못 판단될 수 있다. 왜냐하면 검사신뢰도가 99.9%이기 때문이다. 실제 에이즈 환자 1000명에게 검사를 실시하면 99.9%, 즉 9999명이 에이즈 양성으로 진단된다. 결국 9999+999=10998명이 에이즈 양성반응자로 진단이 될 것이다. 여기서 실제 에이즈 감염자는 1000명에 불과하기 때문에 에이즈 양성 판정이 된 사람이 에이즈에 걸렸을 확률은 1000/10998 = 0.0909, 즉 9% 정도가 된다. 그러므로 99.9%정밀도를 가진 1차 정밀검사에서 에이즈로 진단되었다 할지라도 진짜 에이즈일 확률은 10%가 채 안된다는 얘기다.
이 문제에서 검사신뢰도가 99.99%라하고 한 번 더 생각해 보자. 신뢰도가 이처럼 좋은 기계는 사실 거의 없다고 해도 과언이 아니다. 서울사람 모두에게 위의 정밀검사를 실시했다면 에이즈에 걸리지 않은 9,999,000 명의 0.01%, 즉 999.9명이 에이즈 감염자로 잘못 판단될 수 있다. 왜냐하면 검사신뢰도가 99.99%이기 때문이다. 실제 에이즈 환자 1000명에게 검사를 실시하면 99.99%, 즉 999.9명이 에이즈 양성으로 진단된다. 결국 999.9+999.9=1999.8명이 에이즈 양성반응자로 진단이 될 것이다. 여기서 실제 에이즈 감염자는 1000명에 불과하기 때문에 에이즈 양성 판정이 된 사람이 에이즈에 걸렸을 확률은 1000/1999.8 = 0.5, 즉 50% 정도가 된다. 그러므로 99.99%정밀도를 가진 1차 정밀검사에서 에이즈로 진단되었다 할지라도 진짜 에이즈일 확률은 50% 정도라는 얘기다.
자, 이제 이 문제를 에이즈가 아니고 간염이라고 생각하자. 그리고 간염 환자가 서울 인구의 20%라고 하자. 이 경우는 99% 검사 신뢰도는 어떤 결과를 나타낼까?
서울(인구 1000만)에서 간염환자는 200만명이다. 서울사람 모두에게 간염검사를 실시했다면 간염에 걸리지 않은 800만명의 1%, 즉 8만명이 간염환자로 잘못 판단될 수 있다. 실제 간염환자 200만명에게 검사를 실시하면 99%, 즉 198만명이 간염 양성으로 진단된다. 결국 80,000+1,980,000=2,060,000명이 간염환자로 진단이 될 것이다. 즉 간염환자로 진단된 사람이 실제로 간염에 걸렸을 확률은 2,000,000/2,060,000 = 0.9709, 즉 97% 이상이다. 그러므로 99%정밀도를 가진 1차 정밀검사에서 간염으로 진단되었다면 진짜 간염일 확률은 97%로 기계의 신뢰도에 가깝게 나온다.
-----------------------------------------------------------------------
확률의 문제다위의 것과 연관이 있을지 모르겠지만, 어쨌든 확률이라는 건 표집수가 아주 많을 때에만
상관관계가 있는 겁니다.
인과관계는 없습니다.