아마존보다 큰 알리바바 그들이 빅데이터에 목숨을 거는 이유
알리바바가 중국판 블랙프라이데이라 불리는 11월11일, 즉 광곤절 하루에 16조5천억원의 매출을 올렸던 것에 놀랐던 사람들이 많다. 하루에 그런 막대한 돈을 버느냐보다 더 놀라운 건, 이런 막대한 온라인 주문을 무리 없이 다 처리하고 배송까지 이상 없이 완료하는 시스템이다. 알리바바로 주문이 들어오면 배송지, 물건, 비용 등 20여 가지 세부 정보들이 15개 물류 회사 및 617개 중대형 물류센터와 동시간으로 공유된다. 이를 바탕으로 중국 전역엔 72시간내, 해외엔 7일내에 가장 저렴한 비용으로 제품을 배송한다. 여기서도 빅데이터 분석 시스템이 핵심이다. 심지어 알리바바가 중국 경제신문 제일재경 지분 30%를 인수하고, 홍콩 일간지 사우스차이나모닝포스트(SCMP)를 인수한 것도 빅데이터 전략과 연관된다. 뉴스 소비 패턴 분석을 통해 고객 니즈를 사전에 파악하기 위해서 신문사를 인수한 것이다. 참고로 알리바바는 아마존보다 매출이 두 배 이상 더 많은 세계 최고의 전자상거래 회사인데, 알리바바그룹에는 금융과 유통, 헬스케어와 미디어, 엔터테인먼트 사업도 각기 전개된다. 즉 이들 모두 서로 결합되어 더 큰 시너지를 거둘 핵심으로 빅데이터가 그룹 중심에 존재하고 있다는 점이 이들의 향후 행보를 더 주시하게 만든다.
산업인터넷의 수요 증가와 기업의 선택
GE의 제프리 이멜트 회장은 2020년까지 GE가 세계 10대 소프트웨어 회사가 되겠다는 비전을 공표했다. 세계적 경제위기 상황이자 기업의 위기 시대에 그들이 살아남을 방법을 산업인터넷이자 빅데이터에서 찾겠다는 의미다. 제조업에 큰 기반을 가진 GE는 고객들의 생산성을 높이기 위해 산업인터넷을 핵심으로 삼았고, 지능적인 공장이나 지능형 송전망을 통해 생산성과 효율성을 높이는 시스템들을 이미 선보였었다. 제조업의 환경이 혁신적으로 변화하는 시기를 맞은 지금, GE로선 오히려 기회라 여긴다. 제조업 기반을 가진 이들이 산업인터넷 소프트웨어를 결합해 시장에서의 입지를 더 강화하겠다는 것이다. 가령, 미국 사우스웨스트항공은 GE의 산업인터넷 소프트웨어를 활용해 최적의 비행시간표를 산출하는데, 온도와 습도, 풍향, 풍속, 비행기 무게, 각 공항 상황 등 다양한 변수를 빅데이터로 활용한다. 이렇게 사우스웨스트 항공은 연간 1억달러 정도의 연료비 절감효과를 거뒀다고 밝혔다. 이렇듯 산업 현장에서 빅데이터를 활용한 산업인터넷의 수요는 계속 커질 수밖에 없고, 모든 기업들에겐 빅데이터가 더이상 선택이 아닌 필수로 여겨지고 있다.
빅데이터는 우리의 일상을 바꾼다
서울시는 2016년부터 대중교통운영체계 개선에 빅데이터 시스템을 도입한다. 교통카드 사용자료를 기반으로 승객의 이용패턴의 구체적인 현황을 분석해 노선을 신설하고 개편하거나, 대중교통 운영변경에 대한 기준으로 삼겠다는 것이다. 그 동안엔 국가교통데이터베이스의 가구통행실태조사 자료를 근거로 대중교통운영체계를 조정해왔는데 상대적으로 신뢰성이 낮은 표본조사라는 한계를 가지고 있었다. 빅데이터를 활용할 수 있기 전까진 그것이 최선이었지만, 이젠 빅데이터를 통해서 좀더 정교하고 구체적인 분석이 가능해진 것이다. 빅데이터는 표본이아닌 전수조사이기 때문이다. 그동안 각종 교통수요예측의 오류로 만성적자에 시달리거나, 실제 수요와 괴리가 생기는 사업들이 발생했었다면 빅데이터는 그런 오류를 줄이는데 기여할 것이다.국책연구기관인 한국전자통신연구원(ETRI)는 서울아산병원과 함께 헬스케어 빅데이터 분석 플랫폼을 공동연구한다. 400여만명의 환자, 6억7700여만건의 처방, 2억6800만건의 진료기록, 2200만건의 영상기록 등 방대한 서울아산병원의 임상정보를 익명화해 연구용 빅데이터 인프라를 기본으로 구축했다. 여기에 일일 외래환자 1만2천여명, 연간 수술환자 6만여명의 데이터를 계속 연구해서 질병예측 플랫폼을 만들겠다는 것이다. 국민건강보험공단에서도 방대한 건강보험 빅데이터를 바탕으로 한국인의 질병 예측이나 맞춤형 건강서비스를 지속적으로 전개하려 한다. 공공의 이익을 위한 빅데이터 활용은 향후 정치, 사회적으로 아주 중요한 이슈가 된다. 물론 이런 빅데이터 활용에서 개인정보유출문제가 민감하게 제기되곤 한다. 하지만 이 문제는 법제도적으로 해결해야 할 문제인 것이지, 이것 때문에 빅데이터 연구 확장이 멈춰선 안 된다. 왜냐하면 빅데이터를 통해 공공 분야의 비용 대비 효과를 극대화하는 것이, 공공의 예산을 절감하고 효율성을 제고하는 방법이기 때문이다. 이처럼 빅데이터는 우리의 일상 구석구석에 크고 작은 영향을 미치게 된다.
선거의 해, 빅데이터에 대한 기대감이 뜨겁다
2016년 한국은 총선이, 미국은 대선이 예정돼 있다. 정치적으로 가장 뜨거운 이슈가 생기는 해가 선거가 있는 시점이다. 바로 올해가 그런 셈인데, 4월 총선을 앞두고 이미 한국에선 빅데이터를 활용한 선거전략을 다루는 세미나가 곳곳에서 열리고 있다. 빅데이터 솔루션을 정치 버전으로 개발한 소프트웨어회사가 셀 수 없이 많이 등장했고, 누구나 빅데이터만 가지면 선거필승전략이 될 거라는 주장까지 서슴지 않고 한다. 점점 선거에서 온라인이자 SNS의 영향력은 커진다. 모두에게 일방적으로 보내는 두루뭉술한 메시지보단 개인별로 꽂힐 구체적인 메시지를 보낼 필요도 커진다. 이는 선거 때뿐 아니라 평소 정책에 따른 여론조사 방식에도 변화를 준다. 평소 모든 정치 사안별로 국민들의 평가이자 지지율이 실시간으로 더 정교하게 측정되는 시대가 되면서, 결국 빅데이터는 선거와 정치에서 가장 강력한 요소가 되고 있다. 사실 이런 배경에는 2012년 미국 대선의 영향이 컸다. 오바마 대통령이 대선에서 승리했던 원동력으로 빅데이터가 있었기 때문이다. 당시 오바마캠프에서는 여론조사기관, 광고회사, 후원금 모금단체, SNS 등에서 찾은 빅데이터와 유권자 명부를 결합해서 유권자들의 성향을 구체적으로 분석했다. 이를 활용해 선거자금을 대규모로 모을 수 있었다. 아울러 유권자에게 지지를 호소하는 이메일을 보낼 때도 인종과 성별, 나이와 계층에 따라 20여가지로 분류한 맞춤형 메시지를 각기 유권자 성향별로 구분해서 보냈다. 이 또한 빅데이터 분석을 통해 유권자 개개인의 성향 파악이 되었기 때문이다. 심지어 선거 후반부에는 페이스북에서 ‘좋아요’를 누른 지지들을 대상으로 경합지역에 사는 친구들에게 오바마 지지를 호소해줄 것을 당부했는데, 무려 20%의 사람들이 이런 당부 메시지를 받고 실제로 그 역할을 수행했다. 결과적으로 대부분의 경합지역에서 이길 수 있었고, 바로 빅데이터 분석에 따라 구체적인 메시지를 보내 목표하는 실행을 이끌어냈던 것이 중요한 배경으로 꼽혔다. 물론 한국에선 미국 대선에서의 사례가 그대로 적용되긴 어렵다. 선거인 명부 공유도 안되고, 현행 우리 선거법에 저촉되는 것도 많기 때문이다. 즉 변화하는 시대에 맞는 제도적 개선이 한국에서 필요하다는 얘기다.
끝으로, 빅데이터는 공공재이다. 독점이 아닌 공유가 무엇보다 중요한 화두다. 미국의 MLB는 2007년 투구궤적 시스템인 PTS를 설치했고, 2015년부턴 투구궤적은 물론이고 타구와 선수들의 움직임까지 모두 포착하는 스탯캐스트 시스템을 막대한 돈을 들여 모든 구장에 설치했다. 여기서 나오는 방대한 데이터를 MLB의 자회사가 관리하고 다양한 분석을 통해 비즈니스를 한다. 흥미로운 건 한 경기당 3~7TB 정도의 데이터가 생성된다는데, 이런 로(raw) 데이터는 모두 무료로 공개된다. MLB는 이런 빅데이터 무료 공개를 통해 빅데이터가 공공재라는 의미임을 밝힌다. 오히려데이터의 독점이 다양한 아이디어 생성을 방해하고, 관련 분야의 콘텐츠나 비즈니스의 발전에도 걸림돌이 된다는 것이다. MLB 30개 팀의 실력이 점점 평준화되는 현상이 최근 추세인데, 이런 배경은 빅데이터 통계 분석을 더 적극적으로 활용하면서 가능했다라는 주장도 힘을 얻고 있다. 즉, 다양한 공공분야의 빅데이터가 더 많이 공유되어서 더 다양한 아이디어가 우리나라에서도 넘쳐나길 기대해본다.