신문이나 방송에서 여론조사를 발표할 때 '표본오차는 95% 신뢰수준에서 ±3%포인트'란 표현이 항상 있는데 무슨 뜻인가요?

­―대구 수성구 독자 정해오씨

A: 표본오차란 표본을 대상으로 측정한 수치와 모집단의 실제 수치와의 차이

홍영림 정치부 기자

여론조사는 전체 국민을 대상으로 실시하는 것이 아니라, 대략 1000명가량의 표본을 선정해서 실시합니다. 약 3800만명에 달하는 전국의 모든 성인 남녀를 대상으로 여론조사를 하는 것은 정확한 값을 구할 수 있을지는 모르겠지만, 시간과 비용 측면에서 불가능하기 때문입니다. 그런데 표본을 전체 국민을 대표할 수 있게 잘 추출한다고 해도 표본을 대상으로 측정한 수치와 전체 국민(모집단)의 실제 수치(참값) 간에 차이가 발생하게 되는데, 이 차이를 표본오차(sampling error)라 합니다. 여기에서 '오차'는 실수를 범한다는 의미의 오류가 아니라, 표본을 사용하는 여론조사에서 얻어지는 근사치의 범위를 의미합니다.

예를 들어 존엄사에 대한 우리 국민의 찬반 의견은 모든 성인 남녀를 대상으로 조사하기 전에는 정확한 값을 알 수가 없습니다. 단지 어느 정도의 구간으로 예측을 할 뿐입니다. 어떤 여론조사에서 존엄사에 대해 찬성 70%, 반대 30%를 '95% 신뢰수준에서 표본오차 ±3%포인트'인 결과를 얻었다면, 동일한 형태의 조사를 100번 실시했을 경우 95번은 존엄사에 대한 찬성이 67~73%(70%±3%) 사이의 비율일 것이란 얘기입니다. 즉, '신뢰수준'이란 표본에 의한 조사 결과의 확실성 정도를 표현하는 것이며, 보통은 95%의 신뢰도를 사용해 그러한 판단을 내립니다.

표본오차는 조사결과의 모든 수치에 각각 적용됩니다. 그래서 '95% 신뢰수준에서 표본오차 ±3%포인트'인 대통령 선거 여론조사에서 A후보 40%, B후보 20%라면, 동일한 조사를 100번 실시했을 경우 95번은 A후보가 37~43% (40%±3%), B후보가 17~23%(20%±3%) 사이의 지지율을 얻게 된다는 것입니다. 이 경우엔 A후보가 B후보를 확실히 앞선다고 말할 수 있지만, 만약 A후보 30%, B후보 28%라면 얘기가 달라집니다.

또 여론조사에서 신뢰수준이 95%일 때 표본오차는 표본의 수에 따라서 달라집니다.