여론조사와 샘플링의 덫 Unsampling
오늘 6월 2일의 지방선거 때문에 지금 여론조사가 한참입니다. (물론 천안함사건으로 인한 전쟁설이나 그로 인한 경제하강이 더 큰 이슈이긴 합니다.) 현재 여러 조사기관에서 각 지역별 후보들의 지지율을 발표하고, 또 각 후보들은 자신들에게 유리한 지지율데이터도 공개하고 있습니다. 현재 각 지역의 지지율에 관련된 신문기사들이 많기 때문에 별도의 수치나 링크는 생략하겠습니다. 그리고, 전국의 지지율을 언급하는 것도 문제가 있으니, 일단 수도권 (서울, 경기, 인천)만을 생각해보겠습니다. 현재 조사기관에 따라 수치는 조금씩 다르겠지만, 여당후보 (오세훈, 김문수, 안상수)들이 야당후보 (한명숙, 유시민, 송영길)를 5~10%정도 앞선 것으로 보도되고 있습니다. 그런데, 제가 의문을 가지고 있는 것은 인터넷 상으..