아래와 같은 질문이 들어왔습니다. 요약하자면, 현재 고등학교 문과생인데, 빅데이터 또는 데이터마이닝에 관심이 생겨서 이 분야로 진로/진학을 하고 싶은데 어떻게 하면 좋을까요?입니다.
(전략) 지금 수시원서접수를 코앞에 둔 서울인문계고등학교 재학중인 문과 고3여학생인데, 글을 읽어보면 컴공을 추천하셨는데 문과에서는 현실적으로 가기 힘듭니다... 그렇다면 대안책으로 심리학과를 추천하시나요? 심리학보다는 통계학이 나을까요?(통계학이 문과에 있는 학교가 무척 제한적이고 그중엔 학부의 입시특성상 제가 지원하기 힘든 학교도 있어서, 다른과를 더 찾아보고 있습니다.)
(중략) 만약 흥미로 이쪽 분야로 가려고 한다면 문과계열 중 어느학과를 추천하시고, 이후 어떤 식으로 공부해나가는걸 추천하시는지. 이런 막연한 환상섞인 관심같은 것을 가지고 가도 괜찮은건지(일단 가서 공부하다보면 알수있겠죠?), 가서 내가 이 길로 가야겠다는건 어떻게 알수있는지 막연하게 여쭤봅니다.
(이상적으로) 불가능하지는 않지만 (현실적으로) 쉽지도 않다는 말부터 해줄 수 밖에 없습니다.
데이터마이닝을 전공하기 위해서는 기본적으로 수학과 컴퓨터와 친해져야 합니다. 이 부분에는 큰 이견이 없으리라 생각합니다. 그런데 문과생이 진학할 수 있는 쪽은 대부분 인문학이나 예체능 쪽입니다. 아시듯이 인문 및 예체능에서 수학이나 컴퓨터를 제대로 다루는 학과가 거의 없습니다. 질문을 듣고 생각해봤는데, 그나마 수학 (통계)이나 컴퓨터와 관련이 있는 학과는 사회학이나 수리경제학, 계량경제학정도가 떠올랐습니다. 그렇다고 그냥 사회학과나 경제학과로 진학하라고 쉽게 말씀드릴 수 없습니다. 왜냐하면 사회학이나 경제학의 극히 일부에서 수학과 컴퓨터를 활용하기 때문입니다. 그래서 학과보다는 해당 학교/학과의 교수님들의 구성을 잘 보셔야 합니다. 교수님들 중에서 사회 현상을 수리적으로 분석하고 컴퓨터 프로그램으로 모델링하는 분이 계셔야 하고, 또 경제학과에서도 그런 분이 계셔야 합니다. 그런데 그런 분이 계신다 하더라도 대학원이 아닌 학부 과정에서 자신의 연구 분야를 (계론 이상으로) 강의하는 경우가 흔치 않습니다.
제가 다른 글에서 심리학 얘기를 꺼낸 적이 있는데, 이는 심리학을 전공하면 데이터마이너가 될 수 있다는 얘기는 아닙니다. 데이터마이너가 된 이후에 더 성공적인 데이터마이너가 되는데 도움이 될 수 있다는 얘기를 한 것입니다. 데이터마이닝이 크게 (여러 소스에서) 데이터를 뽑아내고/수집하고 그 데이터에서 패턴을 찾아내는 분석의 과정과 뽑혀진 패턴에서 의미를 찾아서 가치를 덧붙이는 해석의 과정으로 이뤄졌습니다. 수학/통계나 컴퓨터 (알고리즘 및 구현)에 능통하면 앞의 분석의 과정은 그나마 쉽게 해결할 수 있지만, 여전히 해석의 과정은 미궁에 남습니다. (많은 문제들에서) 해석의 과정에서 인간이나 사회에 대한 이해가 필요한 경우가 많기 때문에 인문학이 중요하다고 말하는 것입니다. 그리고 실제 데이터마이닝을 전문으로 하는 업체들도 최근에는 수학 및 컴퓨터 전공자들보다 -- 이미 수학 및 컴퓨터 베이스를 구축한 상태이므로 -- 인문학 전공자들을 채용해서 해석 파트를 맡기는 것도 일종의 추세입니다. 그런데 비율상으로 수학/컴퓨터 전공자들이 데이터마이닝 업체에 입사하는 것보다 인문학 전공자들이 입사하는 비율이 극히 작기 때문에 특정 업체의 현상/트렌드를 일반화시킬 수가 없습니다. (즉, 이공계 전공자 100명 중에 10명이 데이터마이닝 업체에 취직할 수 있다면/한다면, 인문학 전공자들은 100명 중에 1명도 취직하지 못 하고 있다는 의미정도로 받아들이면 됩니다.)
전혀 불가능한 것이 아니라면, 통계학과나 산업공학과정도에는 지원을 해보는 것도 좋을 것같습니다. 통계학이 그나마 수학 분야에서, 그리고 산업공학이 공학 분야에서 가장 소프트하기 때문에 문과생들도 쉽게 적응할 수가 있습니다. 그것도 아니면, 전과나 편입을 하는 것도 당장 고려해볼 수 있습니다. 학부과정에서 수강, 청강 또는 (인터넷) 강의 등을 통해서 기본 수학 (선형대수, 확률통계 정도) 지식을 쌓고, 컴퓨터 관련 수업 (프로그래밍, 데이터구조, 알고리즘 정도)을 들으면서 기초 지식을 쌓은 후에 데이터마이닝 관련 대학원에 진학하는 것도 방법입니다. 그러나 쉽지는 않습니다. (부전공이나 복수전공을 하는 것도 좋지만, 인문학과 공학을 동시에 마스터하는 것은 개인의 노력이 많이 필요합니다. 현실적으로 전과를 하는 것이...)
대학/학부에서는 기초적인 지식만 배우기 때문에 학부를 졸업해서 당장 데이터마이너로 커리어를 이어가기가 힘듭니다. 수학이나 컴퓨터 전공자라하더도 특출난 재능이 없다면 처음부터 데이터마이닝 관련 팀으로 채용될 가능성도 매우 희박합니다. 실제 커리어의 시작은 관련 대학원에 진학하거나 아니면 관련 업계에 취직해서 몸으로 배우는 것밖에 없습니다. (다음을 기준으로) 주변에 문헌정보학과를 졸업한 분들이 좀 있습니다. (일부를 제외하면 대부분 기획자지만...) 그리고 개발자 분 중에서 영문학과를 졸업 후에 개인적으로 프로그래밍을 마스터해서 개발자로 전향하신 분도 계십니다. 데이터마이닝이 컴퓨터 분야에서도 조금 특수하지만, 개인의 의지와 노력에 반해서 접근불가능한 영역도 아닙니다.
그리고, 스티븐 레빗의 <괴짜 경제학>이나 댄 애리얼리의 <경제 심리학> 등의 책을 보면 실험 및 수치데이터를 이용한 행동경제학을 다루고 있습니다. 혹시 지금 관심사가 단순히 데이터마이닝/빅데이터를 해보겠다는 것이 아니라, 이상의 책에서 소개된 경제, 사회 현상에 대한 수리적 분석 및 해석에 관심이 있는 것은 아닌지도 잘 생각해봐야 합니다. 다른 글에서도 밝혔듯이 데이터 (& 분석) 자체에 대한 관심이 아니라, 데이터 분석을 이용한 다양한 사회현상을 검토, 검증해보는 것 (책에서처럼 특정 현상을 비교한다거나 다양한 트렌드를 찾아낸다거나)이라면 데이터마이닝 트랙보다는 문과를 선택했을 때에 가졌던 인문학에 대한 관심을 더 살리는 것이 바람직할 수도 있습니다.
좀더 기술적인 내용도 처음에는 적으려 했지만, 당장 그런 내용을 다루는 것은 적합해보이지 않아 보여서 생략합니다. 혹시 진로가 결정되고 또 그 때에도 여전히 데이터마이닝에 관심이 있고 커리어를 준비한다면 다시 요청하시면 더 기술적인 내용 (어떤 과목이나 도구, 알고리즘 등을 공부해야하는가 등)을 알려드리겠습니다. 여러 이야기를 적고 있지만, 이상은 모두 저의 개인적인 경험과 견해를 말하는 것이지 일반적인/공통된 해법을 제시하는 것은 아닙니다. 인문학자가 데이터 분석가가 되는 것은 현실적으로 많은 장벽이 존재합니다. 그러나 데이터 해석가가 되는 것은 어떤 측면에서 수학이나 공학을 전공한 기술적인 사람들보다 더 좋은 조건을 가졌다고 생각합니다. 이것 아니면 안 돼라는 생각보다는 더 다양하고 엉뚱한 상상과 경험을 하고 식견을 넓히는데 더 많은 노력을 투자하세요.
** 질문은 언제든지 환영합니다. 단, 원하는 답변을 얻지 못할 수는 있습니다.
페이스북 페이지: https://www.facebook.com/unexperienced
---
- 댓글 하나. 국문학 또는 언어학 하다가 linguistic statistics나 NLP쪽 거쳐서 mining으로 넘어가는 테크트리가 가능하겠네요.
- 댓글 둘. 제가 거의 이런 테크를 탄 거 같은데..(저는 데이터마이너라고 하기도 좀 어렵지만요) 문과생이라고 하더라도 결국은 수학이나 통계와 친해야할 것 같습니다. 제 주변엔 문헌정보학과로 석사까지 하고 데이터마이닝이나 개발 분야에서 일하는 분이 몇분 정도 계신데, 데이터마이닝을 하기 위해 문헌정보학을 전공하는 것은 추천하지 않습니다.(전공자 중에 이 분야에서 일할 확률이 1%나 될까 싶습니다.)