본문 바로가기

DM ML AD

[상담] 데이터과학 대학원에 가고 싶은데 어떻게 하면 좋을까요?

아래처럼 (제가 요약한 것임) 현재 의용공학 4학년생의 고민글을 페메로 받았습니다. 원하는 바를 짧게 해결해줄 수는 없겠지만 나름 제 생각을 적겠습니다. 순전히 저의 개인적인 경험과 지식을 바탕으로 적는 글이니 각자의 상황에 맞게 취사선택하기 바랍니다.

의용공학과 4학년생입니다. 졸업과제로 질병 발생 예측 분석을 하면서 데이터과학에 관심을 갖게됐습니다. 확률통계는 수강했고 코딩은 원래 좋아해서 분석 프로그래밍에 별 어려움은 없습니다. 1년 정도 유급해서 통계, 분석 과목을 더 수강해서 학사 학점을 높여 대학원에 진학하고 싶습니다. 학교 경영학과에 데이터마이닝을 하는 연구실이 있다고 해서 알아보고 있고, 현재 학점으로 다른 학교 대학원에 진학할 수 있을지 의문입니다.
학교 내에 적당한 연구실/교수님이 없다면 다른 학교 대학원에 가야 할지 아니면 학원에서 관련 지식을 습득해서 진로를 정하는 게 맞을까요?

상황에 따라 다르겠지만 학원은 추천하지 않습니다. 비슷한 고민을 몇 번 받았지만 학원을 옵션으로 고려해보라고 조언했던 적은 딱 한번밖에 없습니다. 그때는 모기업의 개발팀 내에서 데이터 분석 및 머신러닝으로 업무를 확장하는 단계였습니다. 즉, 데아터과학 전공자는 없지만 이미 개발 경험이 풍부한 개발자들이 모였고 단기간에 문제에 맞는 지식을 습득해서 문제를 해결해야 하는 상황이었습니다. 팀원 중에 몇 명이 대학원에 진학해서 지식을 습득할 수도 없고 비전공자들끼리 어떤 교재를 택해서 무턱대로 스터디를 진행할 수도 없는 노릇이기 때문에, 현실적 대안으로 짧고 집중할 수 있는 학원 또는 패스트캠퍼스같은 과정을 고려해보라고 했습니다. 이전에 IT회사 기획자분의 고민에서는 학원이 좋은 선택이 아니라고 분명히 말했습니다.

데이터과학으로 진로를 조금 더 일찍 정했더라면 좋았을 텐데라는 일말의 아쉬움은 있지만 그럼에도 아직은 졸업을 유예해서 학교에서 관련된 지식을 더 습득하고 고민의 시간을 더 가질 수 있는 재학생이라는 점은 매우 고무적입니다. 우선은 대학원 진학을 목표로 하고, 부족한 수학과 컴퓨터과학 분야의 과목을 더 수강하셨으면 합니다. (수학: 선형대수, 확률통계, 미적분 등 / 컴사: 데이터베이스, 데이터구조, 머신러닝, 소프트웨어엔지니어링, 이산수학 등)

그러면 어떤 (학과의) 대학원으로 진학하면 좋을 것인가? 먼저 본인이 하고 싶은 것이 무엇인지를 명확히 하시기 바랍니다. 데이터 분석이나 머신러닝 알고리즘을 연구해서 새로운 방법론을 찾는 것에 흥미가 있는지 아니면 여러 현실적인 문제를 데이터와 알고리즘으로 해결하는 겟에 흥미가 있는지를 분명히 해야 합니다. 전자라면 컴사/컴공과나 수학과에서 머신러닝을 다루는 연구실로 진학하는 게 좋을 거고, 후자라면 일반적인 공대 (산공, 전기전자, 화공, 바이오 등)에서 데이터를 다루는 연구실로 진학하는 게 맞을 겁니다. 계량경제라거나 데이터 기반의 의사결정을 하는 경영학과에서도 수학, 데이터, 알고리즘을 어느 정도 다루겠지만, 본인의 데이터과학자로 발전가능성이나 운용 영역의 한계는 분명히 있을 것으로 생각됩니다. (이 분야에 직접 경험이 없어서 정확하지는 않음) 그렇기에 가급적이면 공대 내의 연구실을 알아보는 게 더 나을 듯합니다. 물론 개인의 성향이나 관심 분야가 경영이라면 경제학과나 경영학과 내의 연구실이 맞을 겁니다. 일반적인 커리어패스를 고려해서 공대 연구실을 추천한 것입니다.

본인이 의용공학을 전공했으니 (의료기기나 그런 걸 공부/연구하는 분야가 맞는 거죠?) 바이오/생명공학/의료 쪽에서 데이터와 알고리즘을 다루는 연구실을 알아보는 게 1차원적이지만 좀 더 명확해 보입니다. 학과마다 조금씩 다를 겁니다. 수학과는 어쩌면 상상하는 (데이터) 연구와 다를 수 있습니다. 최근 트렌드를 반영해서 응용수학 쪽은 다를 수 있지만, 일반적인 데이터과학과 거리가 멀 수도 있습니다. 컴퓨터사이언스/공학은 좀 더 알고리즘 개발에 특화돼있다고 보면 좋을 것 같고 프로젝트를 하면서 구현에 초점을 둘 가능성이 높습니다. 그리고 대부분 요즘 AI기술로 각광받는 이미지 처리나 텍스트/자연어 처리 분야를 다룰 가능성이 높습니다. (어차피 하드웨어 쪽은 아니실테니…) 추천엔진 등도 컴공에서 관심을 갖겠지만, 산업공학 쪽도 괜찮을 수 있습니다. 최적화를 연구 모토로 삼는 곳이라서 산공과에서 추천 (및 응용)이 더 자연스럽습니다. 하지만 산공과는 전통적으로 제조현장에서의 데이터를 다루는 경향이 강해서 분야가 한정될 수 있습니다. 전기전자는 보통 시그널 프로세싱, 화공에서는 플랜트 공정 관리, 생명공학은 DNA나 의료데이터 (최근에는 의료이미지)를 주로 다룬다고 보면 됩니다. 물론 개별 연구실/교수님마다 연구분야가 매우 다르고 세분화돼서 대학원을 알아볼 때 더 조사해봐야 합니다.

본교 대학원을 진학하면 좋은 점은 적응이 쉽다는 것입니다. 일단 생활 영역이 바꾸지 않는 것도 큰 장점이고, 학점이 조금 낮더라도 미리 교수님과 친분을 쌓아두면 입학에 큰 어려움이 없을 수도 있다는 점, 그리고 주변 지인 네트워크를 통해서 연구실에서 하는 일의 내용도 미리 파악할 수 있고, 가장 중요한 것으로 교수님의 성향을 미리 파악할 수 있다는 것입니다. 대학원생에게 교수님의 성향, 성격은 매우 중요합니다. (X은 어디에나 있습니다. 피할 수 있다면 피하는 것이…) 타대학으로 진학하면 자신이 원하는 분야의 연구를 하는 더 적합한 연구실/교수님을 찾을 수 있다는 점이나 혹시 현재 학교보다 더 상위 학교가 가능하다면 그에 따른 이점이 있습니다. 단점은 본교 진학의 장점의 역… 즉, 학점의 불이익이나 연구실, 특히 교수님에 대해서 정확한 평판을 얻지 못해서 (표현이 그렇지만) 인생이 꼬일 수 있다는 점… 인터넷이나 기사에 나온 평판만으로 절대 결정하면 안 됩니다.

현재 학점이 다소 낮은 것이 타학교 대학원 진학에 다소 장애가 될 수 있지만, 절대 극복할 수 없는 장애는 아닙니다. 원하는 적당한 연구실/교수님을 찾았다면 자신의 현재 상황이나 계획 등을 자세히 적어서 이메일 등으로 미리 컨택하면서 가능성을 타진해볼 수도 있습니다. (요즘은 세상이 워낙 이상해져서 이런 식의 접촉이 특혜나 비정상 절차처럼 비치는 게 아쉽지만…) 외람된 말이지만 (곡해는 마시고) 목적/방향/생각이 없을 때 주먹구구식으로 듣고 얻은 수업/학점 때문에 미래의 가능성을 제한하지는 말았으면 합니다. 현실적으로 본교의 대학원 진학이 다소 쉬울 수 있지만, 원하는 바가 명확하다면 타대학 또는 유학을 옵션에서 제외하지는 말았으면 합니다.

서두에 밝혔지만 현재 (재학생 신분으로) 학원은 좋은 옵션이 아니라고 봅니다. 설령 학원에서 많은 것을 배우더라도 그걸로 좋은 회사에 취직하는 게 가능할까?라는 생각도 듭니다. 물론 학원에서 기초를 확실히 다지고 케글 등에서 제공하는 여러 데이터 문제를 잘 해결한 경험이 있다면 얘기는 달라지겠지만, 학원은 당장의 테크닉을 가르쳐줄 뿐 기초를 다져주지 않습니다. 제가 면접에 들어가서 떨어뜨리는 지원자들 중에 10에 10은 모두 기초가 없는/약한 이들입니다. 요즘은 많은 알고리즘들이 오픈소스로 나와서 그냥 그걸 설치해서 사용해도 어느 정도 결과를 낼 수 있는 시대지만, 그 이상으로 발전하려면 제일 중요한 것은 기초입니다. 물론 대학원에 진학해서 수업 몇 개를 더 듣는다고 해서 기초가 거저 다져지는 것도 아닙니다. (현실적으로 이력서에 ‘XX학원 다님’이라고 적는다면…?)

지식과 경험과 경력에도 마태효과가 발동합니다. 특히 데이터과학에서는 더 그렇습니다. 부익부 빈익빈입니다. 기초 지식이 없어서 좋은 회사에 입사하지 못하고 작은 기업에 입사합니다. 그런데 주변에 도움을 줄 조언자/멘토가 없습니다. 그렇게 발전 없이 몇 년을 보내고 다른 인프라 (사람과 환경)가 잘 갖춰진 기업으로 이직할 수 있을까요?

…. 마지막으로 대학원에 가겠다면 그리고 진학한 연구실이 (여러 의미에서) 나쁘지 않다면 가능하면 박사까지 하는 걸 권합니다. 석하 2년은 이력서에 한 줄 이상의 의미는 없다고 봅니다. 

바른 선택을 하시기 바라고 더 궁금하면 자유롭게 질문하세요.

반응형