'여론조사'에 해당되는 글 1

  1. 2016/04/16 수명다한 전화 여론조사....그럼 빅데이터는 믿을만한가?

사용자 삽입 이미지

지난 13일 치러진 20대 총선에서 예상을 뒤엎는 결과들이 속출했다. '전화를 통한 여론조사 방식도 이제 한계에 다다른 것 아니냐'는 평가가 나왔다. '여론조사가 아니라 여론조작'이라며 분노섞인 반응도 적지않다.

실제로 총선전날까지만하더라도 국내 주요 4개 여론조사 기관들은 공통적으로 새누리의 의석을 145석~175석 사이, 더민주는 100석 안팎, 국민의당은 호남에서의 막판 바람에 힘입어 25석~30석 정도로 예상됐었다.

뚜껑을 열어본 결과, 더민주가 새누리당을 제치고 제1당이 되는 경악스러운 결과가 나타났다. 국민의당은 예상보다 더 의석을 얻었고, 정당지지율은 더민주를 앞섰다.

전문가들은 전화 여론조사 응답에 소극적인 20, 30대 젊은층의 표심을 담아내지 못했고, 집전화 위주의 비현실적인 조사채널이 이같은 여론조사와 실제와의 괴리가 생기는 가장 큰 원인으로 지목했다.  

그렇다면, 앞으로 전화 여론조사를 대체할 현실적인 대안은 무엇인가?

두말할 것 없이 '빅데이터'다.

대다수의 전문가들은 이미 수년전부터 SNS 등 소셜미디어와 온라인상의 비정형 데이터까지도 여론분석 대상에 포함시키는 빅데이터 기법의 보완이 필요하다고 지적해왔다.

그러나 아직까지 빅데이터는 실험적으로만 존재할뿐 실제 신뢰를 부여해야만하는 여론조사에 활용된 사례는 없다. 빅데이터로 분석된 결과치를 해석하는 기준이 아직 크게 미흡하기 때문이다.

데이터 수집과 분석의 기술적인 어려움은 크게 없지만 이 데이터를 어떻게 해석해야하는 것은 사실 전혀 다른 얘기다.  

외형상 빅데이터 분석기법은 단순하다. 분석기법이 다양하긴하지만 SNS상의 텍스트분석, 즉 특정어의 노출, 검색어 빈도 등을 가중치를 부여해 수치화시키는 것이 골격이다.

그러나 이같은 SNS상의 관심도를 호감 또는 비호감으로 판단할 수 있는 근거, 또는 긍정적인 여론인지 부정적인 여론인지 재해석할 수 있는 분석기법이 제대로 제시될지는 의문이다.

전화 여론조사 방식처럼, 기호 1, 2,3, 4번식으로 선호도 조사를 한다면 해석의 여지가 크게 없겠지만 빅데이터는 전혀 상황이 다르다.

예를들어 사전투표가 시작된 8일과 9일, 네이버, 다음 등 주요 포털의 검색어 상위 1위에 '문재인 광주방문'이 올랐고, 페이스북과 등 SNS상에서도 단어의 노출 빈도와 관심도가 급증한 것으로 빅데이터 분석을 통해 도출됐다.

그렇다면 빅데이터 분석에선 이것을 '호남지역에서의 더민주의 지지'로 해석해야 할 것인가?

(여론조사 전문가들은 소셜 미디어에서 가장 최악은 긍정이든 부정이든 관련 단어가 아예 거론 자체가 안되는 '무관심'을 꼽고 있다)

[##_http://rockki.delighit.net/owner/entry/edit/1C%7C2389618116.png%7Cwidth=%22500%22%20height=%22326%22%20alt=%22%EC%82%AC%EC%9A%A9%EC%9E%90%20%EC%82%BD%EC%9E%85%20%EC%9D%B4%EB%AF%B8%EC%A7%80%22%7C_##]

실제로 문 전 대표의 방문이후 반응은 뜨거웠다.

언론 매체들도 '호남지역에서 더민주가 바닥을 찍고 다시 반등하고 있다' 또는 '아직은 아니다'라는 식의 현지의 엇갈리는 반응을 쏟아냈다.  


물론 주지하다시피, 13일 저녁, 실제 호남지역의 개표함을 열어본 결과, 더민주는 호남 전체에서 3석을 건졌을뿐 23석을 차지한 국민의당에 완패하는 예상밖에 결과로 나타났다.

결과적으로 호남에서 문재인 전 대표의 방문은 상황을 반전시킬만큼의 효과가 없었던 것으로 해석할 수 있다.

그렇다면, 빅테이터 분석은 완전히 틀린 것인가.

여기에서부터는 해석의 문제다.  

선거관련 전문가들은 대체적으로 '문재인 광주방문'이란 검색어는 야권분열에 위기의식을 느낀 수도권 야당 지지자들의 결집을 이끄는 촉매제로 작용했고, 수도권에서의 전략적 교차투표(Crosss Vote)를 통한 압승을 이끌어 냈다는 분석을 내놓고 있다.

즉, 문재인 전 대표의 호남 방문으로 생성된 소셜미디어 데이터의 해석을 호남 뿐만 아니라 수도권까지 확장시켜서 해석해야 제대로 된 평가 또는 가치(Value)를 부여할 수 있다는 결론이 나온다.

빅데이터 기술로 수집된 데이터를 분석할때 이같은 '나비 효과'까지 감안해야 현실적으로 유의미한 대응이 가능하다는 의미가 된다.

하지만 아무리 빅데이터 기술이 발전한다 하더라도 사전에 이같은 정확한 해석이 가능할지는 의문이다.  '사람의 마음'을 읽는 기술이 아직은 현재의 빅데이터 기술로는 역부족이라고 생각되기 때문이다.

최근 빅데이터가 만병통치약처럼 회자되고 있지만 따지고 들어가면 역시 데이터를 강력하게 수입하고 재분배하는 프로그램일 뿐이다.

빅데이터에서 도출된 데이터를 직관적으로 판단하고 가치를 부여하는 것은 결국 '인간의 몫'이다.

여론조사 뿐만 아니라 기업의 빅데이터 기반의 엔터프라이즈 전략도 크게 다르지 않다.

<박기록 기자>rock@ddaily.co.kr  

2016/04/16 00:09 2016/04/16 00:09