블로그 방명록을 통해서 또 질문이 들어왔습니다. 개별적으로 답변할 수도 있지만 비슷한 고민/의문을 가진 분들을 위해서 공개적으로 글을 적습니다. 질문을 요약하면 아래와 같습니다.
1. 빅데이터 분야로 진출하기 위해서 인문학부생으로서 컴퓨터공학과와 통계학(수학) 중에서 어느 쪽으로 전과/복수전공하면 좋을까요?
2. '빅데이터'에 대한 부정적 시각도 많은데 관련된 미래 직업/산업에 대해서 어떻게 전망하시나요?
한줄 답변
- 컴퓨터 공학과
- 표지가 바뀐 고전인지 세련된 표지의 잡지인지는 책자을 열어봐야 안다. 그리고 고전도 시대정신을 따른다.
개인이 처한 모든 상황과 배경을 모르기 때문에 원하는 답변이 아닐 수도 있고, 또 여러 생각으로 길게 적다보니 중언부언할 수 밖에 없음을 양해바랍니다. 철저한 계획이 아닌 어쩌다 보니 지금에 이른 (데이터 분석업을 하는) 사람으로서 제 경험만으로 진로상담해주는 것은 부적합하다고 보지만...
데이터 과학을 하기 위해서 컴퓨터 기술과 수학/통계 지식이 중요하다는 것을 알고 있다는 것에서 매우 고무적입니다. (개인적으로는 도메인 경험을 더 중시하는 입장이지만, 현장의 문제를 확인한 후에 그것을 해결하기 위해서 다시 필요한 기술과 지식을 익히는 것이 자연스러우나 현실적으로 불가능한 구조입니다.) 어쨌든 데이터과학자가 된다는 것은 적당한 컴퓨터를 다루는 기술이 있고 (일반적으로 프로그래밍을 의미함) 적절한 수학 지식을 갖췄다는 의미입니다. 여기서 자신의 진로 방향에 따라서 수학을 잘 아는 컴퓨터공학자가 되느냐 아니면 컴퓨터를 잘 다루는 수학자가 되느냐에 따라서 데이터 과학자로서의 자신을 정의할 수 있습니다.
데이터 과학을 위해서 컴퓨터와 수학이 필요하지만, 모든 컴퓨터 기술이 데이터 과학에 필요한 것도 아니고 모든 수학 커리큘럼이 데이터 과학의 기초가 되지도 않습니다. 모든 학문이 서로 연결됐기 때문에 많이 알수록 다양한 측면에서 도움이 되겠지만, 현실적으로 컴퓨터 공학의 일부와 수학/통계학의 일부를 접목한 것이 데이터 과학입니다. 데이터 과학이라는 별도의 학과가 없는 상황에서 -- 이론적 연구자가 되기를 희망하는 것이 아니라면 -- 수학/통계학을 잘 아는 컴퓨터 공학자가 되는 것이 데이터 과학자가 되는 길이라고 봅니다. 회사에 취직해서 실생활의 문제를 해결하는 것이 진로 방향이라면 컴퓨터공학과로 진학해서 필요한 수학/통계학과 과목을 수강하는 것을 추천합니다. 특히 대학원 진학도 염두에 두고 있다면 데이터 과학을 하는 수학연구실은 (거의) 들어본 기억이 없습니다.
컴퓨터 사이언스가 수학의 한 분야에서 시작했고 다시 데이터 과학은 컴퓨터 공학의 큰 부분이 돼고 있습니다. 결국 데이터 과학은 수학을 기반으로 한 컴퓨터 공학의 분야로 보는 게 맞을 듯합니다. 수학/통계 지식이 데이터 과학을 하는데 중요하지만 컴퓨터 기술은 오늘 날의 데이터 과학에 필수불가결한 요소입니다. 쉽게 사용할 수 있는 많은 통계 패키지와 데이터 라이브러리들이 흔해졌지만... 실질적으로 오늘날과 같이 데이터를 활용하는 분야에서는 수학/통계학자보다는 컴퓨터 공학자의 역할이 더 적합하다고 봅니다. 왜 통계학자가 빅데이터에 실패했는가?와 같은 류의 글들이 몇 년 전에 여럿 있었다는 것만으로도 데이터 과학에서의 사고의 틀 및 기술세트가 무엇인가를 잘 설명해준다고 봅니다.
오늘날 데이터 과학이 주목을 받는 것은 실생활의 문제와 밀접하게 연결되면서 부터입니다. 이론이 연구실을 벗어나서 실용이 되는 과정에서 데이터 과학이 빛을 발하고 있습니다. 정보 지식 사회에서 '실용'이라는 것은 결국 컴퓨터화를 뜻하고, 그걸 달리 말해서 프로그래머블 programable을 뜻한다고 봅니다. 생각을 컴퓨터 언어로 표현할 수 있어야 한다는 뜻입니다. 데이터 과학도 결국 수학이 컴퓨터 언어로 번역됐기 때문에 가능한 분야입니다. 그리고 두번째 질문과 연결이 되는 부분이기도 한데, 지금은 데이터 과학과 관련한 수많은 오픈 소스와 라이브러리들이 넘쳐나고 있고 그걸 어떻게 잘 활용하느냐라는 엔지니어링의 문제가 됐습니다. 순수 수학자가 되는 것이 꿈이 아니라면, 그런데 데이터 과학이란 게 학문보다는 실용의 X라는 점을 고려한다면...
길게 적었지만, 지금 구체적으로 어떤 상황에 처해있고 개인적으로 어떤 계획을 가지고 있는지를 잘 모르지만... 두개의 선택지만 존재한다면 컴퓨터 공학을 추천합니다. 대부분의 데이터 및 인공지능 관련 연구 및 발전은 컴공과에서 나오고 있습니다. 아주 심도깊은 연구 (새로운 알고리즘을 개발한다거나...)를 하기 위함이 아니라면, OR/최적화 관련 교수님이 여럿 있는 산업공학과도 인문학과생에게는 더 편할 수도 있습니다. (산업공학이 데이터과학을 위해서 좋다는 것이 아니라, '현재 학교의 산업공학과에서 OR/최적화 등에 강점이 있다면'을 뜻함.)
'빅데이터'가 마케팅 용어라는 점에는 저도 전적으로 동의합니다. 하지만 빅데이터라는 용어가 탄생될 수 있었던 사회적(?) 환경을 봐야 합니다. 1~20년 전에도 데이터 분석이라는 분야는 존재했지만 왜 갑자기 빅데이터라는 이름을 불리게 됐을까?를 생각해봐야 합니다. 말 그대로 '빅' 데이터라 부를만한 데이터들이 생겨나고 있고 또 적절히 그걸 다룰 수 있어졌고, 그래서 과거에는 상상도 할 수 없었던 것을 이제 할 수가 있게 됐습니다. 데이터의 종류와 양이 기하급수적으로 늘어났고 또 그걸 처리할 수 있는 다양한 기술과 인프라를 갖게 됐습니다. 별로 섹시하지도 않은 '빅데이터'라는 용어가 등장했다는 것은 -- 물론 일부에서는 자신의 기술세트에 대한 생명연장인 경우도 존재하고 거짓 데이터 에반젤리스트들이 존재하지만 -- 단순히 포장지를 바꾼 것만은 아닙니다. 물론 빅데이터라는 용어는 이제 식상해져서 또 새로운 용어를 찾을 것이고, 최근에는 인공지능과 결합해서 새로운 포장지를 찾고 있는 것도 사실입니다. 하지만 이는 역설적이게도 데이터 및 그걸 활용하는 것은 몇 십년 전 과거부터 오늘날, 그리고 앞으로도 계속 필요하다는 것을 보여주는 것입니다. 마케팅을 위해서 책 표지를 항상 바꾸는 것은 잘못된 관행이라 할 수 있지만, 표지가 바뀌었다고 해서 내용이 쓰레기라고 부를 수는 없습니다.
사실 저도 나름 데이터 과학을 하고 있다고 말하지만 -- 최근에는 조금 다른 업무를 하고 있지만 -- 이 분야의 전망, 더 정확히 말해서 직업적 안정성에 대한 미래는 잘 모르겠습니다. 예전에는 그냥 코딩만 하면서 서비스를 구축하던 친구들이 최근 쏟아지는 데이터 관련 오픈소스를 이용해서 데이터 분석 또는 데이터 기반의 서비스를 쉽게 만드는 모습을 보면서 과연 나는 앞으로 무얼 할 수 있을까?를 매일 고민합니다. 데이터 업무가 점점더 쉬워지면서 소위 일반 개발자들이 데이터 개발자가 되는 이 시대에, 내가 지금 다시 프로그래밍 기술을 더 익혀서 그들보다 더 나은 데이터 과학자가 될 수 있을까?라는 의심이 듭니다. 데이터 과학자라는 저의 입지보다 어쩌면 데이터 개발자라는 그들의 입지가 더 커지고 있는 것을 부인할 수 없습니다. (<== 이 현상에 문제가 없다는 것은 아님) 일반론으로 돌아가서 지금 각광을 받고 있는다고 해서 미래가 안전한 것은 아닙니다. 그건 지금은 없어진 많은 과거의 직업이 증명해줍니다. 원론적으로 돌아가서 '과연 내가 뭘 하고 싶은가?', 즉 꿈이 무엇인가의 문제이지 이 직업에 미래가 있는가?의 문제가 아닙니다. 산업이 무너져도 장인은 남을 수 있습니다. 직업의 측면으로 데이터 과학을 보는 것이라면 -- 세상의 모든 다른 직업들과 마찬가지고 -- 이 직업은 미래가 없습니다. 직업은 도구일 뿐입니다.
냉정하게 생각해보시기 바랍니다. 이미 인문학부생이라고 밝혔습니다. 즉, 나이는 20대에 접어들었고 고등학교 때는 이과가 아니었을 가능성이 큽니다. 문과였다면 더 어렸을 때부터 수학이나 과학을 싫어했을 가능성이 큽니다. 지난 5년 또는 10년 동안 수학이나 과학보다 인문학을 더 좋아했던 20대 초반의 인문학과 학생과 어릴 때부터 과학영재라는 소리를 들으면서 자라나서 지금 컴공과나 수학과에 진학한 학생이 있는데, 둘다 데이터 과학자 -- 직업의 안정성을 떠나서 -- 가 되고자 한다면 누가 더 잘 할 수 있을까요? 후자가 더 유리할 수 밖에 없습니다. 하지만, 무엇을 위해서 데이터 과학자가 될 것인가?라는 질문 why으로 돌아가서 생각한다면 결과는 다를 수 있습니다. 예를 들어, 전자의 학생이 소설가가 꿈이었는데 데이터 기반의 인공지능 소설창작 기계를 만들기 위해서 데이터 과학자의 길로 접어든다면 얘기는 달라지지 않을까요?
새로운 포장지를 계속 만들고 있다는 것은 최후의 발악일 수도 있지만 책 표지만 바꿔도 여전히 유효하기 때문일 수가 있습니다. 데이터 과학은 아직은 후자에 가깝습니다. 하지만 직업적 안정성이라는 측면으로 데이터 과학을 선택하겠다면 더 잘 할 수 있고 더 좋아하고 더 자신만이 해야하는 직업을 찾는게 낫습니다. 언론에서 '미래의 유망 직업' 등의 소개글도 그걸 적은 사람이 한번 더 기자 코스프레를 할 수 있게 해주는 것 뿐이지, 그걸 읽는 독자나 그들의 자식들의 미래 먹거리를 걱정하고 알려주는 것이 절대 아닙니다. 로봇과 인공지능이 시대에 안정적인 직업은 없습니다. Absolutely.
저는 당신의 꿈을 응원합니다.
=== Also in...