사용자 삽입 이미지
'역설'(Paradox)이라는 표현은 논리적이면서도 가끔은 문학적이다.  무엇을 원하면 원할수록 해소되는 것이 아니라 오히려 갈증의 강도는 더욱 깊어진다. 사랑도 그렇고 삶이 그렇다. 실제로 살아가다보면 '역설'이란 단어 말고는 따로 설명할 수 없는 일들이 너무나 많다.
'저축의 역설'. 경제학원론에 나오는 말이다. 케인즈언의 총수요이론을 설명하기위한 개념이다. 경제적인 풍요을 위해 사람들이 현재 소비를 포기하는 대신 허리띠를 졸라매고 저축을 늘린다. 하지만 그럴수록 시장은 침체된다. 소비의 감소로 생산이 감소하고 기업들의 매출은 줄어든다.
또 실업율은 올라하고 결국 개인들의 저축액도 줄어든다. 결과적으로  저축은 시장의 역동성을 저해하는 마이너스 요인이 된다. 저축이 개인에게는 부의 증대를 가져올 수 있겠지만 사회전체적으로 봤을때는 그와 반대될 수 있는 것이다.
그렇다면 이런 맥락에서 이번에는 '빅데이터에 대한 역설'을 얘기해보자.
빅데이터(Big Data)에 대한 시장의 관심이 이미 정점에 올라왔다. 이제 거의 모든 산업에서 빅데이터는 현상을 설명하는 기본적인 전제가 되고 있다. "중요한 것은 빅데이터의 볼륨이 아니라 그것을 해석하는 분석의 기술"이라는 정의도 확립됐다.
그러나 한편으론 이제 서서히 빅데이터에 대한 거부감 또는 반작용도 만만치 않게 커지고 있다는 점이다.
최근 금융 당국은 '비식별화를 거친 개인정보는 빅데이터로 활용할 수 있도록 하겠다'는 방침을 밝혔다. 물론 이번 금융 당국의 '비식별화 조치' 이전에도 개인정보로 분류되지 않은 정보를 기업들이 빅데이터로 활용해도 법적인 문제는 없었다.
다만 개인정보보호법과 전자거래금융법 등 기존 법의 경계에 걸쳐있는 개인정보의 범위를 보다 분명하게 구분해줌으로써 금융회사 또는 이를 이용하려는 기업들의 혼선를 줄여다는 정도의 의미를 부여할 수 있다.
그러나 '개인정보의 비식별화'는 지금까지 생각하지 못했던 전혀 다른측면에서 매우 큰 의미를 가진다. 특히 핀테크 시대에서 빅데이터는 그 분석(해석)과 활용에 따라 매우 격렬한 논쟁을 유발할 수 있다.
기술적으로는 분명히 비식별화를 거쳤지만 결국은 그 분석의 결과치가 개인의 삶이나 평판에 다시 부메랑이 되어 되돌아 올 수 있기때문이다.
대표적인 사례로 최근 금융권에서 열풍이 불고 있는 '중금리 대출'을 들 수 있다. '중금리 대출'은 은행금리 보다는 높지만 2금융권 금리보나는 낮은 연리 5~15% 대의 대출 구간을 의미한다.
이러한 중금리 대출 이율을 기존의 방식으로 개인마다 정하는 것은 사실상 불가능하다 .기존의 신용평가 체계와 데이터로는 개인 대출이율의 차별화가 쉽지않기 때문이다.
결국 빅데이터를 이용할 수 밖에 없다. '비식별화된 개인정보'를 활용하고, 필요하다면 개인의 행동패턴까지도 신용평가점수로 치환한다. 필요하다면 소셜미디어의 개인 평판, 즉 '좋아요' 카운트까지도 대출 금리 산출에 활용된다.
현재 나와있는 모바일 스크래핑 기술은 여기까지 가능하다. 그리고 필요하다면 이보다 훨씬 더한 개인의 행동패턴까지도 읽어내는 것은 기술적으로 그렇게 난해한 일은 아니다.
 
그렇다면 이렇게 빅테이터 분석을 통해서 산출된 매우 정교한 개인의 대출이율은 어떻게 해석할 것인가.
'홍길동씨의 대출이율은 9.85%입니다'
누구는 이것을 이율이 아닌 개인의 '삶의 등급'으로 볼 것이고, 또 누구는 이것을 '신용도의 등급'으
로 해석할 수 있다. 물론 개인의 대출이율이 공개 또는 공유는 안되겠지만 누구에게는 마치 출생의 비밀처럼, 대출 이율을 꽁꽁 숨기고 살아가야하는 것은 상당히 피곤한 일일 것이다. (물론 개인 대출 이율을 정할때, 소셜미디어 등에 나타난 데이터는 개인의 동의를 얻어 분석되기 때문에 법적인 문제는 없다.)
이러한 상황 설정에 대해 누구는 '너무 과민하다'고 할 것이고, 누구는 '인간적이진 않지만 그래도 리스크를 줄일 수 있는 합리적인 방법'이라고 평가할 것이다.  또 누군가는 '그나마 빅데이터 때문에 대출 이율을 조금이라도 줄일 수 있어서 다행'이라며 오히려 고마워할 수도 있다.
그리고 또 다른 누구가는 "데이터의 왜곡이 생기지 않겠는가? "라는 약간 다른 성격의 질문을 던질 수도 있다.  즉, 개인의 모든 것을 분석하는 빅데이터 시대로 접어들면서 개인이 평판 데이터를 관리하기위한 의도된 왜곡, 오류 행위가 공공연히 나타날 수 있다는 것이다.
'
만약 이렇게 된다면 과연 빅데이터를 통해 얻고자 했던 궁극적인 효과는 무엇일까.
분명한 것은 빅데이터는 정확한 분석을 위한 기술적 도구일 뿐 그 결과치에 대한 개개인의 해석까지 책임지지는 않는다.
당연한 얘기지만 빅데이터가 혹시 개인이 원하지 않는 영역에 까지 개입하게 된다면 부작용은 생길 수 밖에 없다.
더욱이 사회가 빅데이터 만능주의에 빠진다면, 개인들은 스스로의 의지에 의해 데이터를 의도적으로 왜곡되는 현상이 증가할 수 있다.  
빅데이터로 인해 데이터가 더욱 왜곡되는 현상, 이러한 역설적인 현상에도 누군가는 대응을 해야한다. 
분명한 것은, 이는 최근 빅데이터 활성화 정책으로 인해 시민단체가 제기하고 있는 개인 프라이버시 침해 우려와는 전혀 성격이 다르다는 것이다.
<박기록 기자>rock@ddaily.co.kr
 
   
 
 
 
 
 
 






 
2016/07/18 20:21 2016/07/18 20:21

사용자 삽입 이미지

지난 13일 치러진 20대 총선에서 예상을 뒤엎는 결과들이 속출했다. '전화를 통한 여론조사 방식도 이제 한계에 다다른 것 아니냐'는 평가가 나왔다. '여론조사가 아니라 여론조작'이라며 분노섞인 반응도 적지않다.

실제로 총선전날까지만하더라도 국내 주요 4개 여론조사 기관들은 공통적으로 새누리의 의석을 145석~175석 사이, 더민주는 100석 안팎, 국민의당은 호남에서의 막판 바람에 힘입어 25석~30석 정도로 예상됐었다.

뚜껑을 열어본 결과, 더민주가 새누리당을 제치고 제1당이 되는 경악스러운 결과가 나타났다. 국민의당은 예상보다 더 의석을 얻었고, 정당지지율은 더민주를 앞섰다.

전문가들은 전화 여론조사 응답에 소극적인 20, 30대 젊은층의 표심을 담아내지 못했고, 집전화 위주의 비현실적인 조사채널이 이같은 여론조사와 실제와의 괴리가 생기는 가장 큰 원인으로 지목했다.  

그렇다면, 앞으로 전화 여론조사를 대체할 현실적인 대안은 무엇인가?

두말할 것 없이 '빅데이터'다.

대다수의 전문가들은 이미 수년전부터 SNS 등 소셜미디어와 온라인상의 비정형 데이터까지도 여론분석 대상에 포함시키는 빅데이터 기법의 보완이 필요하다고 지적해왔다.

그러나 아직까지 빅데이터는 실험적으로만 존재할뿐 실제 신뢰를 부여해야만하는 여론조사에 활용된 사례는 없다. 빅데이터로 분석된 결과치를 해석하는 기준이 아직 크게 미흡하기 때문이다.

데이터 수집과 분석의 기술적인 어려움은 크게 없지만 이 데이터를 어떻게 해석해야하는 것은 사실 전혀 다른 얘기다.  

외형상 빅데이터 분석기법은 단순하다. 분석기법이 다양하긴하지만 SNS상의 텍스트분석, 즉 특정어의 노출, 검색어 빈도 등을 가중치를 부여해 수치화시키는 것이 골격이다.

그러나 이같은 SNS상의 관심도를 호감 또는 비호감으로 판단할 수 있는 근거, 또는 긍정적인 여론인지 부정적인 여론인지 재해석할 수 있는 분석기법이 제대로 제시될지는 의문이다.

전화 여론조사 방식처럼, 기호 1, 2,3, 4번식으로 선호도 조사를 한다면 해석의 여지가 크게 없겠지만 빅데이터는 전혀 상황이 다르다.

예를들어 사전투표가 시작된 8일과 9일, 네이버, 다음 등 주요 포털의 검색어 상위 1위에 '문재인 광주방문'이 올랐고, 페이스북과 등 SNS상에서도 단어의 노출 빈도와 관심도가 급증한 것으로 빅데이터 분석을 통해 도출됐다.

그렇다면 빅데이터 분석에선 이것을 '호남지역에서의 더민주의 지지'로 해석해야 할 것인가?

(여론조사 전문가들은 소셜 미디어에서 가장 최악은 긍정이든 부정이든 관련 단어가 아예 거론 자체가 안되는 '무관심'을 꼽고 있다)

[##_http://rockki.delighit.net/owner/entry/edit/1C%7C2389618116.png%7Cwidth=%22500%22%20height=%22326%22%20alt=%22%EC%82%AC%EC%9A%A9%EC%9E%90%20%EC%82%BD%EC%9E%85%20%EC%9D%B4%EB%AF%B8%EC%A7%80%22%7C_##]

실제로 문 전 대표의 방문이후 반응은 뜨거웠다.

언론 매체들도 '호남지역에서 더민주가 바닥을 찍고 다시 반등하고 있다' 또는 '아직은 아니다'라는 식의 현지의 엇갈리는 반응을 쏟아냈다.  


물론 주지하다시피, 13일 저녁, 실제 호남지역의 개표함을 열어본 결과, 더민주는 호남 전체에서 3석을 건졌을뿐 23석을 차지한 국민의당에 완패하는 예상밖에 결과로 나타났다.

결과적으로 호남에서 문재인 전 대표의 방문은 상황을 반전시킬만큼의 효과가 없었던 것으로 해석할 수 있다.

그렇다면, 빅테이터 분석은 완전히 틀린 것인가.

여기에서부터는 해석의 문제다.  

선거관련 전문가들은 대체적으로 '문재인 광주방문'이란 검색어는 야권분열에 위기의식을 느낀 수도권 야당 지지자들의 결집을 이끄는 촉매제로 작용했고, 수도권에서의 전략적 교차투표(Crosss Vote)를 통한 압승을 이끌어 냈다는 분석을 내놓고 있다.

즉, 문재인 전 대표의 호남 방문으로 생성된 소셜미디어 데이터의 해석을 호남 뿐만 아니라 수도권까지 확장시켜서 해석해야 제대로 된 평가 또는 가치(Value)를 부여할 수 있다는 결론이 나온다.

빅데이터 기술로 수집된 데이터를 분석할때 이같은 '나비 효과'까지 감안해야 현실적으로 유의미한 대응이 가능하다는 의미가 된다.

하지만 아무리 빅데이터 기술이 발전한다 하더라도 사전에 이같은 정확한 해석이 가능할지는 의문이다.  '사람의 마음'을 읽는 기술이 아직은 현재의 빅데이터 기술로는 역부족이라고 생각되기 때문이다.

최근 빅데이터가 만병통치약처럼 회자되고 있지만 따지고 들어가면 역시 데이터를 강력하게 수입하고 재분배하는 프로그램일 뿐이다.

빅데이터에서 도출된 데이터를 직관적으로 판단하고 가치를 부여하는 것은 결국 '인간의 몫'이다.

여론조사 뿐만 아니라 기업의 빅데이터 기반의 엔터프라이즈 전략도 크게 다르지 않다.

<박기록 기자>rock@ddaily.co.kr  

2016/04/16 00:09 2016/04/16 00:09

사용자 삽입 이미지
이제는 어느정도 잠잠해진 것 같다.  '땅콩 리턴'으로 명명된 이 사건은 지난 2주동안 거센 여론의 질타를 지나 이제는 한발짝 떨어져서 우리 나라 갑질문화에 대한 반성, 기업의 위기대응 능력과 같은 사회문화적, 경제적 관점에서의 담론으로 한발 물러나는 분위기다.  

그러나 왠지 IT업계의 빅데이터 전문가들이라고 하는 사람들에겐 이제부터 '땅콩리턴'이란 먹이사냥이 본격적으로 시작될 것 같다는 싸늘한 느낌이 든다.  

'땅콩회항 파문으로 대한항공이 얼마나 타격을 입었는가. 빅데이터를 이용해 실시간으로 소셜 분석을 하고, 이에 신속한 대응을 했더라면....'  어찌보면 하나 마나한 뒷북치는 가정을 세워놓고 너도 나도 빅데이터 세일즈에 나설 가능성이 높아 보인다.
     
과연 대한항공이 빅데이터(Big Data)에 더 적극적이었다면 ‘땅콩 회항’ 파문을 최소화 할 수 있었을까.

물론 기술적으로 전혀 뜬금없는 얘기는 아니다. 실제로 뉴스(News)와 링크된 소셜네트워크서비스(SNS) 채널에서 생성되는 비정형 데이터를 실시간으로 분석해내는 ‘소셜 분석시스템’들이 몇 년전부터 국내에서도 선보이고 있기 때문이다.

사용자 삽입 이미지


아직 이렇다할 활용사례는 없는 듯 보인다. 이 솔루션은 기업에 불리한 뉴스가 SNS를 통해 급속하게 유통되는 시점에서 실시간으로 기업에 경고 메시지를 전달함으로써 기업이 위기에 신속하게 대응할 수 있도록 지원한다. 

특히 서비스, 유통, 통신, 금융 등 수많은 불특정 소비자들에 직접 노출된 B2C 기업들에게 국내외 뉴스를 중심으로 분석해내는 미디어 분석(Analytics)시스템을 제시하고 있다.

  ◆“나쁜 뉴스에 실시간 대응,  기술적으로 충분히 가능” = 원래 이 솔루션은 기업들이 블랙 컨슈머를 조기에 잡아내서 기업의 피해를 최소화하기 위한 목적으로 개발됐다. 블랙 컨슈머가 SNS 등을 통해 악의적인 내용을 뿌릴때 즉각 대응하기위한 수단이다.  이를 테면 기업은 SNS상에서 팔로워수, 트윗수,를 분석하고, 긍정직인 내용과 부정적인 내용을 내용을 인덱스를 통해 즉시적으로 산출해낸다.

물론 SNS 뿐만 아니라 키워드를 통한 특이동향 분석이 가능하다. 콜센터(컨텍센터)에서 처리되는 상담및 녹취내용, 또한 인터넷을 통해 접수되는 이메일 내용 등도 분석이 가능하다. 한발 더 나아가  기업이 선제적으로 이를 이용하여 키워드 마케팅을 할 수도 있다 .
 
◆빅데이터의 궁극적인 한계는?  결국 '인간' = 하지만 이는 어디까지는 솔루션의 사용설명서에 나타난 워딩일 뿐이다. 현실적으로 기업이 악의적인 뉴스, 불리한 뉴스에 실시간으로 대응하는 체계를 갖추는 것은 간단한 문제가 아니다. 무엇보다 이 빅데이터(분석) 솔루션을 채택했다고 하더라도 그 회사에 맡는 방대한 SI(시스템통합)작업이 뒤따라야 하기 때문이다.

SI는 기술의 문제가 아니라 기업이 가진 고유의 조직문화, 업무 프로세스를 고려해야하는 문제로 귀결된다. 비정형데이터를 예리하게 분석할 수 있는 스마트한 빅데이터 인프라를 갖췄다하더라도 기업이 ‘위기 상황’에서 적용할 수 있는 위기대응 매뉴얼과 조직, 또 위기가 진정될 때까지의 후속 프로세스를 갖췄는지는 기술외적인 문제다.

즉, 소셜 분석시스템에서 아무리 ‘중대 위험’ 시그널이 쏟아낸다해도 이를 기업의 조직문화가 보수적이거나 구조적으로 의사 전달 프로세스가 막혀있다면 실시간 대응이 불가능하다. 또한  정작 기업의 오너가 위기를 위기로 인식하지 못하고 안이하게 대응하게 된다면 이 역시 파국은 피할 수 없다.  
 
분석의 결과치를 놓고 기업이 그 의미를 정확하게 읽어내는 인사이트(Insight)의 문제는 빅데이터 논쟁의 가장 민감한 부분이다. 이 부분은 가장 IT화 하기 힘들다.

실제로 빅데이터를 활용해 기존의 수많은 ‘전문가(expert) 시스템’과  인텔리전스시스템의 업그레이드가 이뤄졌다. 보험사기방지시스템(FDS)는 대표적이다. 하지만 아이러니 하게도 손해보험사의 손해율을 오히려 더 늘어나고 있고,  보험료는 더 오르고 있다.  

빅데이터를 만능처럼 전도하는 전문가들은 쉽게 동의하기 어렵겠지만 아무리 IT가 발달해도 결국 ‘인간’이란 한계는 극복하는 것은 전혀 별개의 문제라는 생각을 해본다.  IT에게 책임을 묻는것이 아니다. 

오히려 땅콩리턴 사태를 계기로, 그 사회의 문화나 의사결정의 투명성, 조직의 민주적 소통방식에 따라 IT의 효과도 얼마든지 배가 될 수 있다는 생각을 하는 계기가 됐다.
 

2014/12/22 16:47 2014/12/22 16:47

사용자 삽입 이미지

불과 1개월 남짓밖에 지나지 않았지만 2014년 브라질 월드컵의 여운은 온데간데 없다.
다만 이번 2014 월드컵 우승팀이 독일이었다는 것, 그리고 독일이 브라질을 준결승전에서 7대1로 대파했다는 것 정도가 게 뇌리에 남아있다.
 
그리고 또 하나 기억에 남아 있는 것은 '빅데이터' 타령(?)이다.

독일의 선전을 기다렸다는 듯이 지난 월드컵 기간동안 독일계 IT업체인 SAP는 자사의 인메모리기반 기반 플랫폼인 'SAP HANA'를 소개했고, 많은 언론들이 이를 흥미위주로 보도했다. 마치 월드컵의 주인이 IT에 의해 결정난 것 처럼 말이다.

앞서 SAP는 지난 7월1일, 독일이 고전끝에 알제리를 물리치고 8강에 선착하자 SAP는 HANA 기술에 기반한 SAP 매치 인사이트' (SAP Match Insights)를 처음 공개했고, 우승을 차지하자 다시 관련한 보도자료를 냈다.

이를 되짚어보자면  'SAP 매치 인사이트'라는 솔루션은 스카우트 당시 데이터부터, 경기장에서 녹화된 동영상까지 두 동기화해, 코치가 경기의 주요 순간을 손쉽게 분석 할 수 있도록 지원한다. 독일 축구대표팀이 브라질 월드컵을 대비해 솔루션을 완성해달라고 요청했고, 6주 후 SAP는 SAP 매치 인사이트에 코치, 스태프, 선수들이 데이터를 스스로 사용할 수 있는 기능을 추가했다.  베이스 캠프 내 선수들 휴식 공간에 터치 스크린이 설치됐으며, 각각 모바일 기기에 앱을 설치했다.  이로 인해 코치에서부터 선수들까지 각자 편한 시간과 공간에서 원하는 데이터 분석 정보를 보며 경기력 향상에 힘을 쓸 수 있었다. 

결국 독일 대표팀이 SAP 매치 인사이트를 활용함으로써 상대팀보다 우수한 경기력을 보이며 우승 트로피를 들어올렸다는 동화같은 결론으로 얘기는 마무리된다.

그런데 과연 실제로 현장을 지키는 스포츠 감독들은 빅데이터의 효과를 어느정도 신뢰할까.

선수들의 실시간 활동량을 즉시 분석해서 데이터화하는 것은 분명 보다 진일보된 스포츠 과학의 영역이다. 하지만 빅데이터가 승패를 좌우할 핵심 변수로 작용하는지는 아직 선뜻 동의할 수 없다.

스포츠 종목중에서 데이터가 가장 많이 생성되고 또 실전에 적용되는 대표적인 종목은 야구다. 그래서 가깝게 지내고 있는 아마추어 야구 감독들 몇사람의 얘기를 정리해보았다. (물론 이 분들은 IT 전문가가 아니기때문에 빅데이터에 대한 개념을 '데이터에 의한 야구' 정도로 좁혀서 얘기를 나눴다.)

"데이터는 단지 참고만 할 뿐이다."

70년대 고등학교 야구를 거쳐 실업야구(은행단) 출신의 A감독은 "승부에 영향을 미치는 변수는 데이터 말고 여러가지가 있다"고 말했다. 그는 "데이터는 그저 보조적 수단일 뿐"이라고 말했다. 대부분 현장의 야구 전문가들도 거의 비슷한 말을 한다.

실제 현장에서 야구 감독들이 그중 가장 많은 꼽는 것이  '감'(feel)이다. 덧붙이자면, 경기 낭일의 감, 그리고 게임의 분위기이다.  

'빅데이터'라는 어마 어마한 신무기가 등장했음에도 왜 현장의 감독들은 데이터를 단지 참고만하는 '보조적 수단'으로 생각할까. 이는 꼭 야구만이 아니라 일반 기업의 IT담당자들이 빅데이터에 대한 무조건적인 신봉(?)에 거부감을 보이는 이유와 크게 다르지 않아 보인다.

감독들이 데이터에 절대적으로 의존하지 않는 몇가지 이유가 있다.

일단, 데이터는 결코 선행적 지표가 아니라는 것.  물론 스포츠뿐만 아니라 모든 분야에서 데이터는 어디까지나 과거의 행위를 기초로 작성된 후행적 결과물이란 태생적 한계를 가진다.  
 
예를들면, 지금까지 특정 투수에게 지극히 약한 타자였지만 그 단점을 보완하기위해 투수의 공배합을 철저하게  분석하고 들어왔다면 결과치는 앞으로의 장담못한다. 이처럼 데이터화가 불가능한 요인까지 현장에선 고려해야 한다는 것.

그리고 또 하나 재미있는 것이 '데이터의 역설'이다.

데이터에 대한 해석이 현실에서는 전혀 예상치 못하게 극단적으로 나타날 수 있다는 점이다.
야구 경기에서 가장 흥미로운 장면중 하나는 '수비 시프트'이다.  특정 방향으로만 타구를 날리는 타자가 등장하면 수비수들은 그 특정 방향의 커버리지를 높이기 위해 수비위치를 일제히 이동시킨다.
메이저리그에서 한 시대를 풍미한 왼손 홈런 타자 배리 본즈가 대표적이다. 항상 당겨치는 본즈가 나오면  수비수들은 운동장의 반을 비워놓고 전부 우측으로 이동해 '본즈 시프트'를 형성한다.
좌측으로 타구를 날리면 100% 안타가 나오지만 본즈는 그래도 수비들이 우글거리는 우측으로 타구를 날려서 기어코 안타나 홈런을 만들어 낸다.

여기서 재미있는 것은 본즈의 타구가 우측으로 날라가는 이유에 대한 극단적인 해석이다.  수비수들은 과거 데이터만 놓고 봤을때 그가 좌측으로 타구를 보낼 수 없는 '반쪽짜리' 선수라고 생각할 수 있다.

하지만 알고보면 엉뚱하게도 본즈가 좌측으로 타구를 날리지 못하는 것은 자존심 때문이다. 수비수가 없는 텅빈 좌측 공간으로 타구를 날리는 것은 타격 천재인 그의 자존심이 도저히 허락하지 않았던 것이다.

현실에선 이처럼 손쉬운 항로를 마다하고 위험한 선택(?)을 일부러 감행하는 '역설적 선택'이 종종 나타날 수 있다. 과거 데이터만으론 '자존심'이란 심리을 읽어낼 수 없다. 단순하게 데이터를 액면 그대로 믿었다가는 전혀 다른 오류를 범하게 될 수 있다는 점에서 시사하는 바가 크다.

'실전은 데이터가 아니라 상황이 지배한다'
 
사실상 결론이다. 스포츠뿐만 아니라 모든 산업분야의 기업에게도 해당된다. 또 하나의 사례를 들어보자. 절호의 득점찬스에서 평소에 특정 투수에게 매우 강한 타자가 타석에 들어섰다. 하지만 감독은 예상을 깨고 대타를 내보낸다.

데이터상으로는 도저히 이해가 안되는 결정이지만 결과는 좋았다.  감독에게 물어보았다.  "그 타자는 앞선 수비에서 결정적 실책을 저질렀다. 자신의 실수를 공격에서 만회하려고 하는게 느껴졌다. 알게 모르게 어깨에 힘이 잔뜩들어가 있었다. 좋은 결과를 기대하기 어려웠다."고 말했다.

반면 자신에게 강했던 타자가 갑자기 교체되니 상대편 투수는 일단 안심을 했다.  하지만 적시타를 허용하고 말았다. 긴장감이 풀어지면서 볼카운트가 나빠졌고, 결국 스트라이크를 잡으려고 던진 공이 통타당했던 것이다. 

굳이 표현하자면 현장의 감독들이 가장 강조하는 것은 이처럼 빅데이터보다는 이같은 '상황이론'이다. 이같은 상황에 대한 판단은 어디까지나 감독 고유의 영역이라고 생각한다. 물론 혹자는 이것도 비정형데이터를 포괄하는 빅데이터의 영역이라고 할 수도 있겠지만 아직까지는 기계의 힘으로 대체할 수 없는 영역임이 분명하다.

스포츠는 과학이 아니라 '멘탈의 영역'?

언제부터인지 모르겠지만 요즘 스포츠에서 부쩍 빈도가 늘어난 용어가 '멘탈'이다.  이는  투쟁심을 강조하는 '정신력'과는 다른 개념이다.  '어떠한 돌발상황에도 평정심을 유지하는 선수의 정신적인 능력' 정도로 정의된다. 요즘엔 이같은 멘탈지수가 경기력을 좌우하고, 승패를 결정짓는 핵심 요소로 꼽기도 한다. 다른 분야에서도 마찬가지겠지만 실제로 빅데이터 외에 고려해야할 변수들은 너무 많다.  

결국 스포츠 과학의 범주에서 본다면, 이같은 멘탈의 영역까지도 빅데이터화 할 수 있고, 또 궁극적으로 이를 경기력 향상에 도움을 줄 수 있도록 하는 비법이 제시돼야한다. 단순히 기존의 정형화된 빅데이터 분석만으로 스포츠가 포괄하는 영역을 모두 설명하기에는 아직은 많은 부분에서 역부족이다.  

아직까지 데이터는 무한 신뢰의 대상이 아니라 단지 해석의 대상일 뿐이다.  
 


 

2014/08/06 17:49 2014/08/06 17:49