본문 바로가기

Reviews/Book Review

[책소개] 데이터는 언제나 옳다.

어쩌다 보니 책번역에 참여했습니다. 원제목은 'Data Just Right'인데, 번역서는 '데이터는 언제나 옳다'로 정해졌습니다. 그냥 '데이터는 항상 옳다'라고 가번역했는데, 저렇게 출판사에서 정했습니다. 아래는 옮긴이의 글을 다시 올립니다. 책에는 교정돼있지만, 원래의 느낌을 살리기 위해서 최초에 적었던 내용을 그대로 올립니다. 책 가격은 조금 비싼 듯도 하지만, 그건 제 영역 밖의 문제라...

다음책: http://book.daum.net/detail/book.do?bookid=KOR9788998139551

데이터는 언제나 옳다! 대규모 데이터 처리와 분석 실무
국내도서
저자 : 마이클 마누체흐리(Michael Manoochehri) / 정부환,류상호,염화음,이화경역
출판 : 위키북스 2014.05.28
상세보기

===

옮긴이의 글

먼저 밝혀야할 것이 있습니다. 저는 책에 덧붙는 추천사, 감수의글, 옮긴이의 글 등을 싫어해서 대부분 읽지 않습니다. 개인 블로그에 올린 '추천사가 책을 망친다'는 조금 도발적인 제목의 글에서 그 이유를 밝혔습니다. 그런데 지금 제가 번역에 공동 참여하여 이렇게 옮긴이의 글을 적고 여러 분들의 평가를 받아야 하는 아이러니한 상황입니다. 블로그에서도 밝혔듯이 이 글이 책 쪽수만 차지하는 사족이 될 수도 있고 여러분들의 자유로운 사고 및 시각을 방해할지도 모릅니다. 그렇지만 다른 추천사들의 원래 의도가 그러하듯, 여러 분들이 이 책을 읽고 활용하는데 가이드가 됐으며 하는 바람으로 적습니다.

본문에도 나오지만 빅데이터 또는 대용량 데이터 분석이라는 용어로 현재 진행 중인 정보 혁명을 모두 설명할 수 없습니다. 그동안 데이터마이닝이라는 분야가 일반에 덜 알려져서 과소평가를 받아왔지만, 최근에는 빅데이터 물결에 휩쓸려 지나치게 과대포장되어 소개되고 있습니다. 이 분야에서 오랫동안 연구하고 종사했던 분들도 전체를 조망하기에는 너무 큰 분야입니다. 그렇지만 데이터마이닝, 또는 데이터 기반의 의사결정이라는 것이 소수의 전문가들의 전유물에 머무르지 않았으면 하는 오랜 바람이 있습니다. 그런 의미에서 책에서 다루는 다양한 유즈케이스와 관련 기술들이 데이터마이닝과 빅데이터를 처음 접하는 많은 분들에게 도움이 됐으면 합니다.

현재 이 물결에 편승한 다양한 기술들이 매일 등장하고 진화하고 있습니다. 책에서도 다양한 기술들을 소개하고 있지만 전체를 아우르기에는 반의 반도 채 되지 않는다고 장담합니다. 이 책이 쓰여지고 번역되는 동안에도 수많은 기술들이 새로 만들어져서 우리의 선택을 기다리고 있습니다. 이 한 권의 책으로 모두의 필요를 충족시킬 수 없습니다. 그럼에도 불구하고 빅데이터 기술의 흐름을 살펴보고 어떤 기술들이 있는지를 인지하는 것만으로도 빅데이터의 파도를 헤쳐나가는데 좋은 길라잡이가 될 수 있습니다. 저 개인의 경우, 필요할 때마다 부분적으로만 알고 다뤘던 기술 및 흐름을 정리하는 좋은 계기가 됐습니다.

새로운 분야를 시작할 때 대표 기술을 하나 선택해서 깊게 파고드는 것도 연구의 한 방법입니다. 그러나 적어도 급변하는 빅데이터의 파고에 대응하는 적절한 방법은 아닐 수 있습니다. 대학원에 진학해서 연구를 시작하는 단계라면 적어도 1~2년은 기다려줄 수가 있지만, 바로 현장에서 대용량 데이터를 처리해서 의미를 파악하고 새로운 서비스에 적용하는 데는 위험이 따릅니다. 연구를 시작하는 이들에게는 현실적으로 조언하자면, 관심/관련 분야의 전체 흐름을 간략하게라도 먼저 확인한 후에 더 깊게 파고들 세부 분야를 선택하는 것입니다. 나무 몇 그루를 심는다고 당장 숲이 만들어지지 않습니다. 먼저 숲을 확인하고 자신이 가꿀 나무를 선정하는 것이 현실적입니다. 그런 의미에서 이 책은 빅데이터 마이닝을 시작하는 이들에게 좋은 숲지도가 될 것입니다.

처음 출판사로부터 번역 의뢰가 왔을 때 조금 두려웠지만 좋은 경험이 될 것 같아서 수락했습니다. 처음 한 챕터를 번역해보고 '번역하는 것보다 내가 직접 적는게 더 낫겠다'라고 푸념했습니다. 번역이라는 것이 본인의 영어 실력이나 관련 분야의 경험에만 오로지 의존하지 않습니다. 저자의 원래 의도를 파악해야 하고, 그것을 바탕으로 독자들이 쉽게 이해하고 적용할 수 있도록 전달해줘야 합니다. 힘든 과정이었지만 또 의미있는 시간이었습니다. 부족함을 깨닫고 동료를 믿고 기다려야 하는 시간이었습니다. 여러분들도 기회가 된다면 -- 출판을 전제하지 않더라도 -- 번역을 직접 해보셨으면 합니다. 개발자가 가장 많이 사용하는 언어는 C도, Java도, Python도 아닌 영어입니다. 굳이 번역이 아니더라도 영어와 조금이라도 더 친숙해지셨으면 합니다.

처음 하는 장문 번역이라 매끄럽지 못한 부분들도 많이 있습니다. 저희의 부족함에 너른 이해를 바랍니다. 그리고 책내용이나 빅데이터, 데이터마이닝 등과 관련된 다른 의견 또는 질문이 있으시면 저의 블로그나 페이스북을 통해서 연락주시면 저희의 경험을 공유하고 또 저희보다 뛰어난 분들을 연결해드리겠습니다. 제 블로그는 다음검색에서 서두에 언급한 글을 찾으시면 됩니다.

...
옮긴이의 글이 길어지는 것은 바람직하지 않습니다.

"여러 분들의 데이터 항해를 준비하세요. 그리고 떠나세요."

2014년 3월.

==

그리고 아래는 인터넷 등에 책소개 글을 올리는데 필요하다고 해서 적었던 소개글입니다.

인터넷이 보급되면서 데이터의 역습이 시작됐습니다. 모바일 인터넷과 사물 인터넷이 일상화되면서 이제는 빅데이터의 역습이 시작됐습니다. 향후 만물 인터넷의 시대가 도래한다면 빅데이터를 넘어 스마트데이터의 역습도 대비해야 합니다. 오래 전부터 데이터는 우리의 삶에 많은 영향을 주고 있습니다. 빅데이터는 (훨씬) 더 큰 영향을 주고 있습니다. 비즈니스 세계 뿐만 아니라, 일상 생활에서의 모든 의사결정이 데이터를 기반해서 이뤄져야 한다는 얘기입니다. 이제 모든 사람과 조직은 데이터를 적시에 바르게 다루는 기술과 능력을 보유해야 합니다.

불과 3~4년 전만 하더라도 빅데이터를 다룬다는 것, 즉 데이터를 정의하고 수집하고 분석 및 해석해서 의사결정을 내리는 일련의 과정이 소수의 전문가 그룹이나 구글이나 페이스북과 같은 거대 IT기업의 전유물처럼 느껴졌습니다. 불과 몇 년 사이에 처리해야할 데이터의 양과 종류가 기하급수적으로 늘어났고, 또 이를 위한 다양한 기술과 오픈소스가 등장하면서 이제는 데이터는 누구나 접근할 수 있는 공공재가 되고 있고 빅데이터 기술은 누구나 쉽게 다룰 수 있는 보편재가 되고 있습니다.

데이터 및 기술을 누구나 사용할 수 있게 됐지만, 역설적으로 너무나 많은 오픈소스 기술들로 인해서 데이터 기술을 처음 접하는 개인이나 빅데이터 기술을 비즈니스에 활용하려는 기업들은 어떤 기술을 언제 어떻게 활용해야할지 갈피를 잡지 못하는 상황에 이르렀습니다. 이런 (데이터/기술) 혼란기에 마이클 마누체흐리의 오랜 경험을 바탕으로 빅데이터 기술과 흐름을 잘 정리한 '데이터는 언제나 옳다!'는 빅데이터 기술을 배우려는 개발자에게 좋은 길라잡이가 되고 깊은 통찰을 줄 것입니다.

==
페이스북 페이지: https://www.facebook.com/unexperienced

반응형