Share           Pin It
1편이 예상 외로 반응이 좋았다. 그럴려고 적은 글은 아니었는데... 의외의 반응을 얻으면 우쭐해서 다음 글을 적고 싶어지는데, 보통 그렇게 적은 글은 호응이 없다. 어쨌든, 1편에서는 데이터 비즈니스를 하려는 기업들이 의미있는 데이터를 가지지 않았거나 인력과 인프라가 부족하거나 장기적인 전략으로 꾸준하지 못해서 -- 즉, 준비가 제대로 안 돼서 -- 결국 실패한다고 적었다. 오늘은 약간 다른 관점에서 적을 적는다. (참고 링크: 데이터 비즈니스에 실패하는 회사들)

데이터 비즈니스를 한다는 것은 결국 데이터를 비즈니스로 연결한다는 의미가 된다. 그러면 역으로 데이터 비즈니스에 실패한다는 것은 데이터를 비즈니스로 제대로 연결하지 못한다는 것과 같다. 어떤 단계 (관점)을 거쳐서 데이터가 비즈니스로 연결되는지를 알면 데이터 비즈니스 성패의 실마리를 알 수 있으리라 생각한다. 말은 이렇게 거창하게 하지만, 실은 지난 주말에 문득 떠오른 데이터 (엔지니어링), 서비스, 그리고 비즈니스의 단계/연결을 과하게 포장하기 위해서 글을 적는다. 그렇다. 데이터를 정의하고 수집하고 통계자료를 뽑아보는 엔지니어링이 데이터 비즈니스의 첫 단계이고, 이를 서비스로 연결하는 것이 둘째고, 마지막으로 그런 서비스에서 돈을 버는 것이 비즈니스 단계다. -- 끝 --

엔지니어링 단계.
1편에서 좀 터무니없이 적긴했지만, 데이터 비즈니스를 하겠다는 회사들은 기본적으로 인적 및 물적 인프라를 갖추고 있고 데이터를 모을 서비스들이 존재한다고 가정해야 한다. 데이터의 (또는 데이터의 가치에 대한) 개념이 부족할 때는 주먹구구식으로 데이터를 남기고 제대로 활용하지 못했던 것도 사실이다. 뿐만 아니라 당장 활용하지도 못하는 데이터를 쌓아두기 위해서 데이터 스토리지 등의 비싼 하드웨어에 투자를 할 수 없었던 적도 있다. 하지만 오늘날에는 스토리지 가격도 많이 저렴해졌고 웬만한 스타트업들도 카프카 Kafka를 통해서 데이터를 수집하고 HDFS에 분산 저장해서 스톰 Storm이나 스파크 Spark를 이용해서 실시간으로 데이터를 처리한다. (사실 저에게 좀 약한 분야ㅠㅠ)

이렇게 수집한 데이터를 가지고 기초 통계 자료를 뽑아보거나 보기 편하게 각종 시각화 도구를 이용해서 화면에 예쁘게 그래프를 그려준다. 그런데 보통 여기서 끝이다. 기초 통계치를 뽑아보는 것은 단순히 현재 우리 서비스의 트래픽만을 확인하고 '잘 돌아가고 있군'하는 식으로 만족하는데서 끝나고, 실시간 트래픽 그래프를 그려보면서 그저 시스템에 장애는 없는지정도를 확인하는 것을 위한 것이다. 데이터는 결국 서비스를 운영하는 보조적인 열할에 거친다. ** 데이터 엔지니어링의 가치를 낮게 보는 것이 아니라, 추가 분석 등의 작업을 통해서 다음 단계로 넘어가지 못하거나 그걸 어려워한다는 의미다.

서비스 단계.
데이터를 수집한다는 것은 데이터를 -- 데이터 분석을 -- 통해서 서비스를 개선하거나 새로운 서비스를 만든다는 의미다. 데이터 기반으로 서비스를 개선/만드는데 머신러닝이나 인공지능과 같은 거창한 기술을 요하는 것도 아니다. 딥러닝이 대중화(까지는 아니지만)되면서 고급 기술을 사용하는 것만이 데이터 기반의 서비스라고 오해를 하지만, 기본 통계치와 간단한 로직만으로 서비스의 가치를 끌어올릴 수 있다. 데이터에서 인사이트를 얻어서 서비스에 다시 반영하는 사이클을 만드는 것이 서비스 단계다.

기본 통계치를 사용자에게 보여주는 것, 가장 많이 본 (Most Popular) 컨텐츠를 피쳐링해서 보여주는 것과 같은 간단한 것이 데이터의 서비스화의 첫 걸음이다. (그리고 이걸로 충분한 경우도 많다.) 사용자들이 의외로 많이 보는 컨텐츠의 카테고리를 찾아내서 새로운 섹션이나 독립 서비스로 만들 수도 있다. 어려운 기술이 아니다. 이젠 더 적절한 컨텐츠를 어떻게 더 빨리/즉시/적시에 보여줄 수 있을까를 해결해가면 된다. 고급 기술은 필요에 따라서 사용하면 된다. 그렇게 데이터와 알고리즘으로 서비스가 완성되면 이젠 그 기반 위에서 비즈니스가 쉬워진다.
** '대용량 데이터 + 고급 인공지능 기술'이 데이터를 서비스로 만드는 힘이라는 생각이 오히려 데이터를 활용한 서비스의 걸림돌이다. 데이터 서비스도 과유불급이다. 필요한만큼의 데이터와 적정 기술.

비즈니스 단계.
이젠 비즈니스다. 서비스가 데이터 위에서 잘 돌아간다면 비즈니스는 -- 쉽진 않겠지만 -- 어렵지 않다. 보통 '인터넷 비즈니스 = 광고'이므로 광고를 그냥 또 하나의 컨텐츠로 보면 된다. 기본적으로 그렇지만, 이게 쉽지는 않다. 서비스 쪽에선 광고가 서비스의 질을 떨어뜨린다고 반목하고, 광고 쪽에선 서비스가 광고에 우호적이지 않다고 불평한다. 애초에 (어떤 형태로든) 광고가 없는 서비스보다 광고가 붙은 서비스가 질이 떨어지는 것은 일반적이지만, 데이터 비즈니스를 제대로 했다면 광고가 서비스에 방해를 주지도 않으면서 오히려 서비스의 일부로 인식시키거나 가치를 더하는 것으로 만들었을 것이다.

예를 들어, 서비스에서 개인화/추천 기술을 사용했다면 그 속에 광고 컨텐츠를 녹이면 된다. 구글이나 페이스북이 광고를 광고 같지 않게 서비스에 넣은 것이 그들의 성공 요인이다. 의식하지 않으면 광고와 일반 컨텐츠를 구분하기 어렵다. (그래서 광고가 아닌 비즈니스를 해야 한다고 주장하지만, 어렵다.) 스폰서 컨텐츠지만 필요한 사용자에게 전달한다면 그건 컨텐츠로서 가치가 있다. 친구와 주말에 제주도 여행을 가기로 했는데 아직 항공권을 구하지 못했다고 가정해보자. 이 사용자에게 제주도행 항공권을 가지고 있는 여행사를 알려주는 광고가 제주에서 먹고 놀았던 수많은 사진과 게시글 UGC보다 더 낫다. 어떤 상황에서 어떤 컨텐츠를 보여줄 것인가가 결국 데이터 비즈니스의 승패를 좌우한다.
** 플랫폼 기반의 중계 (수익) 모델도 광고BM으로 봐도 무관하다.

광고 컨텐츠의 관점에서 비즈니스를 해석했지만, 더 넓게는 데이터에서 찾은 비즈니스의 가치를 제안하는 것이 비즈니스 단계다. B2C 관점에서 글을 적으니 광고BM이 거의 유일한 데이터 비즈니스처럼 적고 있다. 그러나 B2B에서는 서비스 자체가 BM인 되기도 하고, 데이터 전문 회사는 데이터 및 처리 기술이 비즈니스다. 다양한 데이터나 API를 오픈해서 라이센스를 받거나 기술지원을 하는 것도 비즈니스가 될 수도 있고, (보통 크지 않은) 전문 회사들은 트렌드 보고서를 판매하거나 강연을 통해서 돈을 벌기도 한다.

제목을 좀 자극적으로 '데이터 비즈니스에 실패하는 회사'라고 적었지만, 정상적으로 데이터 비즈니스를 하는 회사는 엔지니어링 단계에서 데이터를 잘 정의해서 수집하고, 기본 통계치 및 고급 분석을 통해서 인사이트를 얻고, 이를 서비스에 녹여서 차원 높은 서비스로 만들고, 그 흐름에서 비즈니스 모델이 잘 동작하게 만든다. 이 흐름이 잘 동작한다면 당장은 큰 이득을 얻지 못하더라도 장기적으로 성공하는 (적어도 실패하지 않는) 회사가 되지 않을까? 물론, 기반이 되는 서비스가 폭망했다면...ㅠㅠ

** 개인정보나 데이터 보호와 같은 이슈는 논외로 한다.
===
B: https://brunch.co.kr/@jejugrapher
F: https://www.facebook.com/unexperienced


댓글을 달아 주세요

Share           Pin It

회사(카카오)는 요즘 고민이 많습니다. O2O를 시작하면서 예견된 일이지만 O2O에서 서비스적 성과는 냈지만 가시적인 비즈니스 성과는 제대로 내지도 못하고 이리저리 치이다보니 카카오라는 브랜드 이미지마저 나빠집니다. 많은 스타트업에 투자하고 인수를 해서 진행한 일도 카카오라는 이름으로 리브랜딩하는 순간 과거의 모든 것은 사라집니다. 대기업의 골목상권 침해라는 프레임으로 기술과 서비스를 평가하는 것에 억울함은 있지만, 그럴수록 상생과 공생, 그리고 번영이라는 어쩌면 시대의 화두에 대해서 더 고민하게 됩니다.

카카오는 카톡이라는 메신저 플랫폼도 가지고 있고 다음이라는 포털도 가지고 또 다른 많은 브랜드와 서비스를 가지고 있습니다. 그러나 매출은 결국 소위 말하는 트래픽 장사로 벌어들입니다. 즉, 광고입니다. 좀 고상하게 표현하면 데이터 비즈니스를 하고 있습니다. 지난 글에서 적었듯이 카카오가 현재까지는 데이터 비즈니스에 현명하지는 -- 이라고 적고 교활하지는 이라고 해석 -- 못했습니다. (참고 링크. http://bahnsville.tistory.com/1121)

결국 현재 카카오는 데이터 비즈니스를 제대로 하는 기반을 마련하면서 카카오를 중심으로 많은 스타트업들과 상생하는 건전한 생태계를 만들어야 하는 숙제를 가지고 있습니다. 이 두가지 -- 상생과 데이터 비즈니스 --를 한번에 해결(까지는 아니고 조금 도움이될)하는 한가지 방법을 제안합니다. (내부 게시판/아지트를 통해서 적었던 글을 외부용으로 편집해서 블로깅합니다.)

제가 생각했던 것은 '오픈 데이터 Open Data' 전략입니다. 즉, 프로그램 소스 코드나 라이브러리, API를 외부에 공개해서 마음껏 사용하도록 하는 오픈 소스처럼 카카오 서비스 생태계에서 확보한 다양한 데이터를 외부에 공개해서 마음껏 사용하도록 지원하는 것입니다. 가칭 Kakao Open Data Initiative (KODI)입니다. 실시간으로 확보하는 모든 데이터를 외부에 공개하자는 얘기는 당연히 아닙니다. 데이터가 기업의 특급 비밀이며 자산인 시대에 모두를 공개하는 것은 말도 안 되는 소리고, 또 (익명화 과정을 거친다손 치더라도) 사용자의 개인정보를 다수 포함한 데이터를 공개하는 것은 다른 법적 이슈도 발생합니다. 그리고 모든 데이터를 공개한다고 해서 방대한 양의 데이터를 한꺼번에 다 가져다쓸 수 있는 곳도 거의 없습니다. (가능한 곳은 카카오의 몇몇 경쟁 회사들 뿐입니다.) KODI의 기본 전제가 연구자들을 위한 데이터 공개입니다.

지금은 데이터의 시대이면서 지능의 시대로 접어들고 있습니다. (글을 처음 적은 날 구글은 AI-first를 선언했습니다.) 인공지능이 화두인 이 시점에 카카오 내부의 인력과 재원만으로 지능의 파고를 제대로 대처할 수가 없습니다. 일부 분야에서 앞선/첨단 기술을 적용해서 서비스화도 시도하고 있지만, 모든 분야에서 딥러닝 등의 머신러닝 기술을 적용할 수가 없습니다. 구글이나 페이스북도 많은 부분에 인공지능을 접목해서 가시적 성과를 내고 있지만 완벽하지는 않습니다. 그런 상황에서 갈길이 바쁜 카카오가 지금 당장 인공지능의 선두회사가 될 가능성은 거의 없다고 봐도 무관합니다. (앞으로의 가능성에 대한 여지는 남겨둡니다.) 최근 주목받고 있는 conversational UI, 즉 지능형 봇을 카톡에 제대로 구현한다거나 AI 기반으로 검색/추천랭킹을 완전히 바꾼다거나 많은 사용자/트래픽 정보를 비즈니스적 가치가 있는 정보로 가공하는 등의 많은 일들을 현재의 카카오 내부 역량만으로는 모두할 수가 없습니다.

회사 내에서 불가능하다면 회사 밖에서 솔루션을 찾아야 합니다. 그래서 많은 스타트업들에게 투자와 인수를 하는 것입니다. 잠재적 동지이며 경쟁자인 스타트업들도 중요하지만, 눈길을 학교로 돌려야 한다고 생각합니다. 수 테라바이트의 데이터가 우수은 빅데이터의 시대지만, 오늘도 열악한 대학원 연구실에는 수십만개, 아니 수만개의 데이터도 없어서 알고리즘을 개발하거나 개선하지 못하는 실정입니다. 10년 전에 추천 알고리즘에 관한 논문을 쓸 때 사용했던 (ML) 데이터나 BookCrossing (BX) 데이터가 여전히 거의 유이한 추천 알고리즘용 데이터입니다. (물론 이들 데이터는 여러 연구를 통해서 검증을 마친 상태라서 레퍼런스하기에 좋다는 장점이 있음) 대학원 연구실에는 실제 현장/서비스가 만들어내는 데이터가 없어서 앞으로 전진하지 못하는 것이 현실입니다. 그 숨통을 확 터여줬던 것이 Netflix Prize였습니다. 사용한 메트릭의 좋냐 나쁘냐의 이슈를 떠나서, 알고리즘 분야에서 10%이상의 개선은 거의 불가능한 과제였지만, 넥플릭스 프라이즈를 통해서 그 벽을 허물었습니다.

넷플릭스처럼 상금대회를 개최하자는 얘기는 아닙니다. 단지 카카오 (또는 데이터를 가진 다른 회사)가 가진 그리고 해결해야하는 문제와 연관된 일부 (안전한) 데이터만 외부에 오픈하자는 것입니다. 많은 연구자들이 카카오의 데이터로 알고리즘을 개발/개선하고 검증하면서 논문을 쓴다고 상상해보십시오. 저는 이 글을 적으면서 상상만으로도 가슴이 벅찹니다. 그렇게 출판된 논문의 알고리즘을 가져와서 카카오의 서비스를 개선할 수 있습니다. 그런 우수한 연구를 한 연구자가 잡마켓에 나왔을 때 카카오가 먼저 사카우트한다면 인적/기술적 자산을 더 풍부하게 만들 수 있습니다. 이미 카카오의 데이터에 익숙해진 연구자라면 취업 후에 적응에 따른 시행착오도 줄일 수 있습니다. 예전에 '넷플릭스 프라이즈를 다시 생각하다'라는 글에서도 적었듯이, 연구논문에 'Kakao의 데이터를 사용했다'라는 문구만 들어가도 큰 홍보가 됩니다. 앞의 포스트에서 넷플릭스는 겨우 $1M이라는 헐값으로 10%개선된 알고리즘도 획득하고 데이터 비즈니스를 하는 회사라는 명성도 얻었다고 적었습니다. 카카오가 그리고 대한민국의 다른 회사들도 그런 명성을 얻을 수 있습니다.

많은 기업들이 자신들이 개발한 소스 코드를 공개하고 데이터를 오픈하는 것은 그들이 바보라서 아니면 세상을 크게 변화시켜야 한다는 대의 때문만은 아닙니다. 공개를 통해서 실질적인 이득을 얻고 있기 때문입니다. 내부에서 기존의 사고에 갇혀셔 같은 데이터를 같은 프로세스로 같은 관점으로 계속 들여다보면 결국 기존의 것과 전혀 다르지 않은 것을 반복할 뿐입니다. 오픈 이노베이션 Open Innovation이 항상 최고의 전략이라는 것은 아니지만, 손대지 않고 코 풀 수 있는 이만한 전략도 없습니다. 카카오가 필요한 기술과 인력을 외부에서 키우면서 카카오는 연구/기술 생태계를 만들어가는 회사라는 명성도 얻을 수 있습니다. 데이터가 21세기의 원유라고 표현하는데, 굳이 혼자 힘으로 다 캐고 정제할 필요는 없다고 생각합니다.

실제 실행에 옮기기 위해서는 고려해야할 사항이 많고, 장애물도 많습니다. 그래서 전략적 차원에서 고민하고 실행해봤으면 합니다. 그게 카카오가 아니더라도, 대한민국의 그 누군가 그리고 그 어떤 기업에서 먼저...

=== Also in...

F: https://www.facebook.com/unexperienced

댓글을 달아 주세요

Share           Pin It

빅데이터의 시대를 지나 스마트 데이터 시대로 접어들고 있다. 주변에서 데이터가 중요하고 데이터 비즈니스를 하겠다고 하는 회사들은 많지만 정작 데이터 비즈니스에 성공한 회사들은 손에 꼽을만하다. 구글, 페이스북, 아마존 같은 세계적인 기업들이나 겨우 데이터 비즈니스에 성공했다. 아니면 아주 특수한 케이스나 기술에 두각을 보이는 잘 알려지지 않은 데이터/기술 스타트업정도만 생각날 뿐이다. 국내에서는 네이버가 그나마 앞서있는 축에 속하지만 기술에 의한 것인지 아니면 마켓파워 때문인지 구분이 조금 어려운 것도 사실이다. 카카오는 네이버에 비하면 데이터 비즈니스를 한다는 말을 꺼내는 것도 민망하다. 카카오가 다른 큰 회사들보다는 데이터 비즈니스를 위한 최소한의 여건을 갖춘 것은 맞지만, 데이터 비즈니스를 한다고 명함을 내밀만한 수준이 아니다. 단적으로 말해서 카카오가 데이터 비즈니스를 제대로 했다면 지금보다는 배이상의 매출이나 이익을 냈어야 한다고 본다.

원래는 조금 추상적인 수준에서 데이터 과학자 또는 조직이 필요한 것이라는 주제로 글을 적으려 했지만 생각을 전개하다보니 데이터 비즈니스를 제대로 못하는 것으로 생각이 바뀌었다. 그리고 이 글에서는 개인정보 보호나 보안과 같은 법적 외부요인은 고려하지 않는다.

어쨌든, 많은 회사들이 데이터 비즈니스를 하겠다고 선언하지만 가시적인 성과를 내지 못하고 흐지부지 시간만 허비하고 실패하는 것일까? 그런 회사들의 모든 사정을 소상히 알 수는 없지만 몇몇 사례들로 일반화해보려 한다. 왜 데이터 비즈니스에 실패하는 것일까?

첫째는 데이터가 없기 때문이다. 데이터 비즈니스에 필요한 데이터도 없으면서 데이터 비즈니스를 하겠다고 선언만하는 경우가 종종 있다. 데이터가 없다는 것은 말 그대로 아무런 데이터도 없는 경우도 있고, 의미있는 데이터가 없는 경우도 있고, 또 데이터 연동이 제대로 안 되는 경우도 있다. 데이터의 중요성을 간과해서 데이터를 남기는 것 자체가 부재했던 시절이 있었다. 데이터 분석할 사람은 뽑았는데 정작 분석할 데이터가 없는 웃지못할 일이 벌어지는 거다. 데이터가 없거나 어떤 데이터를 어떻게 수집할지 등의 대책없는 시작은 필패를 예약한 거나 다름없다.

그게 뭐냐면 여러분들은 데이터가 없어요 (이미지: 마리텔 캡쳐)


그러나 그동안 데이터가 중요하다고 많이들 떠들고 비즈니스 성공 사례들이 알려지면서 어떻게든 데이터를 남기고 있다. 그러나 막상 비즈니스에서 필요한 의미있는 데이터가 없는 경우가 다반사다. 그저 아파치 서버가 남기는 로그가 데이터의 전부인 경우도 허다하다. 이걸로는 방문자수 카운트 이외의 사실상 할 수 있는 것이 아무 것도 없다. 때로는 어디에 어떻게 사용할지도 모르면서 그냥 데이터를 쌓아두는 경우도 있다. 일단 쌓아두면 나중에 어딘가에는 쓰겠지라는 생각이다. 없는 것보다 있는 게 낫지만 고민없이 남긴 데이터는 결국 나중에 사용될 가능성이 낮다. 속된 말로 똥이다. 의미없이 데이터를 남기다 보면 관리가 허술해지고 또 빈 데이터만 남게 된다. (RDB처럼) 데이터 포맷이 정적이었던 시절에는 스키마 변경이 어려우니 처음 만들 때 일단 모을 수 있는 모든 데이터 필드를 만들고, 또 혹시 모르니 extra 필드를 여러 개 미리 만들어두던 것이 별로 오래전 얘기가 아니다. 분석이나 마이닝이 데이터 더미에서 의미를 찾아내는 것이지만, 무의미한 데이터에서 의미를 찾는 것은 마이닝의 할애비가 와도 안 된다.

의미있는 데이터를 남긴다고 해서 모든 게 해결된 것은 아니다. 여러 팀으로 나뉘어 다양한 서비스를 다루는 큰 회사의 경우 데이터 연동이 안 되는 경우가 많다다. 개별 서비스의 니즈에 맞도록 데이터를 남기다보니 형식이나 의미가 제각각인 데이터 사일로들만 존재한다. 그리고 물리적으로 개별 서비스의 로그를 한 곳에 모으는 것도 쉽지 않다. 주기적으로 데이터 허브 프로젝트를 시작하지만 몇몇 대표 서비스의 데이터는 연동하지만 마이너한 것들까지 싱크를 맞추지는 못한다. 그 사이에 새로운 기술과 서비스가 등장하면서 기존의 데이터와 호환되지 않는다. 설마 그렇기야 하겠어라고 생각하겠지만 이거 우리 이야기네라고 동감하는 사람들도 많을 거다. 데이터가 없거나 의미가 없거나 연동이 안 돼서 결국 데이터를 사용하지 못하는 회사는 데이터 비즈니스를 할 수 없다는 것은 자명하다.

두번째로 데이터를 다룰 사람이 없다. 데이터 엔지니어링 관점에서 각종 서비스에서 데이터를 수집하고 저장하는 인력이 부족한 경우도 있고, 수집된 데이터를 가공해서 의미를 찾아내는 데이터 분석가/사이언티스트가 없는 경우도 있고, 분석 이상의 해석이 부재하거나 분석 결과를 바탕으로 의사를 결정하고 실행하는 사람이 없는 경우도 있다. 다행인 점은 기술이 발전하면서 데이터를 수집하고 저장하는 것을 도와주는 다양한 오픈 소스들이 많이 나왔고 관련 기술이 나날이 발전하고 있다. 그럼에도 각자의 상황에 맞게 그런 기술과 오픈 소스를 자유자재로 다룰 수 있는 전문 인력은 여전히 부족하다.

이 단계를 넘어가면 분석할 사람이 없다. (개인적 생각으론) 분석을 굳이 학위를 가진 사람이 해야하는 것도 아니고, 다양한 분석 기술은 결국 인간의 공통된 사고 방식 heuristic을 정형화한 것에 불과하다. 분석 인력이 부족하다는 것은 결국 분석 기술을 가진 사람이 부족하다는 것보다는 자유로운 데이터 사고를 하는 사람이 부족하다는 뜻에 가깝다. 다행히 여러 데이터 분석 도구들이 개발돼서 일반인들도 쉽게 사용할 수 있게 됐다. 그러나 가장 우려되는 점은 선무당이 사람을 잡는다는 속담처럼 (쉬운) 분석툴들이 제공하는 기능과 속성의 의미를 모르고 기계적으로 데이터를 블랙박스에 넣어서 결과를 얻고선 모든 게 해결됐다고 생각하는 거다. 상황에 맞는 적정 도구를 선택하고 설정하는 것이 중요한데, 예를 들어 단순 선형회귀를 위해서 레이어가 10개가 넘는 인공망 (딥러닝)을 만드는 일이 벌어지지 않으라는 보장이 없다. 기술의 사용이 더 쉬워질수록 그것의 기저에 있는 기술과 의미를 더 잘 알아야 한다.

분석 인력이 보강돼든 분석 소프트웨어를 사용하든 데이터 (수치)가 주는 함의를 해석해야 한다. 해석은 공학이나 과학을 넘어선 영역이다. 그리고 결정을 내려야 하고, 결정에 따라서 실행해야 한다. 원했던 효과가 바로 나오지 않더라도, 다시 데이터를 모으고 분석/해석해서 결정을 내리고 실행해야 한다. 조금 개선이 되면 다른 방법으로 더 나은 것을 찾아야 한다. 하고 또 하고 또 하고… 데이터를 수집하고 분석하고 해석하는 전문 인력이 꼭 필요하지만, 결국에는 그걸 바탕으로 결정해서 실행하는 사람이 결정적이다. 비즈니스 레벨에서는 결국 권한을 가진 사람들의 역할이다. 여기서 세번째 이유와 연결된다.

셋째, 데이터 비즈니스가 실패하는 결정적인 이유는 많은 회사(경영진)들이 데이터 비즈니스를 지속시킬 의지가 없다는 거다. 아닌 말로 데이터가 없으면 지금부터 수집하면 되고 인력과 기술이 부족하면 채용하거나 오픈소스를 잘 이용하면 된다. 하지만 데이터 비전과 의지는 다른 차원의 문제다. 데이터 비즈니스는 겉절이 김치가 아니라 1~2년 묵힌 김치다. 단기간에 가시적인 성과를 내지 못할 수도 있다는 얘기다. 그리고 계속 실패하면서 방향을 수정하고 다른 시도를 계속해야 한다. 데이터 과학이라고 말하지만 똑부러진 법칙과 이론이 존재하는 과학이 아니라 실험과 검증의 지나한 과정을 거치는 방법론적 과학이다.

데이터 비즈니스를 하겠다고 선언을 했으면 지원을 하고 (인력을 보강해서 팀을 꾸리고 인프라를 구축하는 등), 그리고 인내해야 한다. 퀀텀 점프하듯이 바로 눈에 띄는 효과를 보이는 경우도 있지만, 대부분은 등락을 거듭하면서 서서히 점진적으로 효과가 나온다. 보통 경영진들도 계약직으로 단기 성과를 내야하는 사람들이기 때문에 짧게는 분기나 반기, 길게는 1~2년 내에 성과를 보여줘야 한다. 그러나 데이터 비즈니스는 그렇게 번개로 콩을 구워먹는 게 아니다. 의지를 가지고 장기적인 플랜에 따라서 하나씩 해결해야 겨우 성과가 나온다. 물론 얼마나 스마트하냐에 따라서 성과의 시기와 크기에 영향을 주겠지만…

데이터 비즈니스가 중요하다는 것은 이제 모두가 잘 안다. 하지만 그걸 성공하는 기업은 여전히 소수다. 데이터 비즈니스를 하겠다는 회사들은 먼저 의미있는 데이터를 확보하고 적정 기술을 가진 인력을 보강했다면, 의지와 인내를 가지고 멀리 보면서 실행하기 바란다. 현재는 직원으로서 카카오가 그랬으면 하는 것이 개인의 바람이고, 카카오를 떠나서 (Beyond Kakao, not leaving Kakao) -- 여전히 내가 데이터 과학을 하는 사람인지는 모르겠으나 오랫동안 데이터를 보는 것을 업으로 했던 사람으로서 -- 그런 조직의 일부가 된다면 기쁠 거다.


=== Also in...

F: https://www.facebook.com/unexperienced

댓글을 달아 주세요