◇8,700가구→5,500가구→8,000가구…표본변화 통계 왜곡 부른다?= 가계동향조사의 표본은 최근 들어 3년 연속 바뀌었다. 2016년까지 매년 8,700가구 수준으로 유지하다가 지난해 5,500가구로 줄였다. 그러다가 올 다시 8,000가구로 늘렸다. 작년 가계소득동향 조사 폐지가 예정돼 있어서 표본 수를 줄였는데 이후 조사 유지로 방침이 바뀌면서 예년 수준으로 ‘원상 복귀’ 시킨 결과다. 표본의 변화, 특히 표본을 늘리는 게 통계의 신뢰도에 영향을 줄까.
통계 전문가들은 “기본을 모르는 소리”라고 잘라 말했다. 통계청의 한 관계자는 “정확한 통계를 위해서는 전수를 조사하는 것이 가장 좋은데 그것이 힘드니까 대표성 있는 표본을 뽑아 조사한다”며 “통계청은 정밀한 표본 설계·추출 기술을 갖췄기 때문에 일정량 이상의 표본에서는 표본의 증감과 상관없이 통계의 신뢰성을 확보할 수 있다”고 설명했다. 이어 “일반적으로 표본 수를 늘릴수록 정확성은 오히려 올라간다”고 설명했다.
◇표본 중복률 급감했다는데…정확성 떨어질까=통계 오류를 주장하는 쪽에서는 올해 조사에서 표본의 ‘교체’가 많았다는 점도 문제를 삼는다. 가계동향조사는 표본을 교체할 때 이전과 이후의 중복률이 66.7%를 유지하도록 권고하고 있는데 올해는 42.5%로 크게 낮아졌다는 것이다.
중복률이 낮아진 이유는 올해 표본 수가 많이 늘어난 데다가 지난해 가계동향조사가 폐지될 것을 예상해 1년 동안 표본 교체를 하지 않았던 영향이 크다. 하지만 교체를 많이 했다는 것 역시 그 자체로 통계 정확성에 영향을 주지는 않는다고 통계청은 설명한다. 박상영 통계청 복지통계과장은 “같은 가구를 오래 조사하면 성실하게 응답하는 확률이 떨어지기 때문에 중복률이 높다고 반드시 좋은 것은 아니다”며 “가계동향조사는 3년마다 표본을 바꾸지만 다른 나라는 개월 단위로 교체해 중복률이 크게 낮은 경우도 많다”고 말했다.
◇노인 가구 비중이 증가해 1분위 벌이가 악화됐다?=결국 중요한 것은 표본 수나 중복률이 아니라 얼마나 대표성 있는 표본을 뽑아내느냐에 있다. 가계동향조사의 경우 소득과 연관이 깊은 주요특성변수를 과거 통계와 일관성을 유지면서도 시대의 흐름을 잘 반영하는 것이 관건이다. 현재 제기되는 비판의 핵심도 대표성 있는 표본을 추출하지 못했다는 데 있다. 대표적인 것이 노인 가구 비중이다. 올해 표본에서 저소득층이 많은 노인 가구가 많이 늘어 통계가 왜곡됐다는 것이다.
하지만 노인 가구 비중이 올해 급격히 늘었다는 지적은 사실이 아니다. 통계청 마이크로데이터를 분석한 결과 가계동향조사에서 노인가구 비중은 상반기 기준 2015년 18.6%, 2016년 20.2%, 2017년 23.0%, 올해 25.3%로 매년 비슷한 비율로 늘었다. 올해 25.3%는 ‘2017 인구주택총조사’ 상의 고령자 가구 비중(26.5%)과도 부합하는 수준이다. 통계 조사의 정확성을 단적으로 보여주는 수치인 ‘상대표준오차’도 문제가 없었다. 통계청은 가계동향조사의 소득 통계의 상대표준오차를 2.5% 이내로 유지하도록 하고 있는데 올해 2·4분기는 1.8%였다. 지난해는 1.9%였다.
/세종=서민준기자 morandol@sedaily.com
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >