본문 바로가기

DM ML AD

데이터 과학자의 글쓰기

글쓰기 테크닉에 관한 글이 아니다. 내가 글을 수려하게 잘 적는다는 의미도 아니다. 그냥 데이터 과학자를 포함한 모든 지식 노동자는, 아니 누구나 평소에 글 적는 걸 즐기고 연습해야 한다는 취지다. 생각은 글로 표현되고 글에서 행동이 나온다.

여름 인턴 멘토링을 준비하면서 멘티들에게 책을 추천, 선물하는 과정이 있었다. 정리 문서에 '개발자의 글쓰기'란 책이 중복 추천되는 걸 봤다. 팀의 다른 멘토가 이 책을 언급했지만 다른 개발자들도 글쓰기의 필요성과 중요성에 공감하고 있는 듯하다. 물론 해당 책은 개발자들이 주로 다루는 네이밍 방식, 소스 코드나 커밋 로그에 주석이나 릴리즈 노트 적는 법, 위키나 지라 작성 법, 제안서 적기 등 Technical Writing을 다루기는 하지만, 적어도 개발자에게 글쓰기가 중요하다는 점은 시사하고 있다. 재택이 일반화되면서 예전에 말로 하던 많은 것들이 이젠 문서 (글)로 대체되고 있다. 텍스트가 다시 중요해졌다.

안타깝게도 내가 멘토링을 맡을 친구가 다른 기업에 정규직으로 합격해서 포기한다는 소식을 (이 글을 처음 적던 날의) 아침에 들었다. 하루 종일 멘털이 붕 떠있다가 늦은 오후가 돼서야 정신을 차리고, 데이터 과학자로 바르게 성장하는 걸 돕기 위해 멘토링 중에 해주고  싶었던 얘기를 정리해서 메일로 보냈다. 기대가 컸고 인턴 통과가 거의 확실한 친구였기에 아쉬움이 많이 남아서 질척거렸다. 원래 그런 성격이 아닌데... 어쨌든 데이터 과학 또는 머신 러닝의 체계를 잡기 위해서 관련 도서 -- 가급적 원서 --를 한 두 권 택해서 처음부터 끝까지 완독 하는 것과 아이폰이 소개될 즈음의 스티브 잡스의 발표(와 자료)를 찾아보고 발표 또는 공유하는 방식에 대해서 고민해보라는 것과 마지막으로 어떤 형태로든 글쓰기를 꾸준히 연습해서 가능하면 간결하고 명확한 글쓰기를 익혔으면 좋겠다는 주제넘은 조언을 했다.

** 전에도 적었지만 이력서/자기소개서에 나열된 문장이 어색한 친구들이 면접을 통과하는 경우가 거의 없다.

글쓰기는 곧 생각하는 법, 생각을 정리하는 법, 생각을 표현하는 법이다. 나는 그렇게 생각한다. 지금 이 문장을 적으면서 어지럽던 내 머릿속 생각들이 정리되고 있다. 데이터 과학자 또는 ML 개발자에게 요구되는 가장 중요한 능력이 단지 기계적으로 구현하고 실험하는 것은 아니라고 본다. 다른 견해도 있겠지만 나는 데이터 과학자의 가장 중요한 능력은 생각하는 법이라고 본다. 문제를 (재)정의하는 것도 생각하는 거고 필요한 데이터를 정의하고 수집하는 것도 생각하는 거고 필요한 방법론을 구상하는 것도 생각하는 거고 실제 구현하고 테스트하는 것도 모두 생각하는 것에 포함된다고 본다. 비약이 다소 심하지만 생각과 상상을 빼고 데이터 과학을 논하는 것은 무리가 있다고 본다. 내가 원하는 데이터 과학자, 특히 후배들은 단순히 기능에 뛰어난 기술자가 아니라 늘 유연하게 사고하는 이였으면 한다.

적절한 단어를 찾아서 간단명료하게 글을 적는 법을 연습하는 것이 데이터 과학의 일반 실행과 크게 다르지 않다. 글이 갖는 기승전결이 곧 데이터 과학이다. 문제를 정의하고 (기) 흩어진 데이터를 모으고 (승) 절절한 알고리즘을 찾아 구현해서 데이터를 분석해서 (전) 서비스에 적용하는 (결) 과정을 짧은 글쓰기를 통해서 꾸준히 연습하는 셈이다. 글을 제대로 적는다는 것은 논리적으로 사고할 수 있다는 뜻이고, 그런 논리적 사고 능력이 데이터 과학자에게 필요한 기본 능력이다. 물론 글을 잘 적는다고 데이터 과학을 잘한다는 의미는 아니다. 그 반대도 역시 아니다.  글쓰기를 연습함으로써 논리적으로 사고하는 능력도 키울 수 있다고 본다.

내가 발표나 글쓰기, 즉 공유를 중요하게 여기는 것은 데이터 과학자의 끝은 공유에 있기 때문이다. 데이터 분석을 잘하는 사람은 삼류고, 분석한 데이터를 자신만의 관점에서 해석해서 인사이트를 얻는 사람은 이류고, 그런 인사이트를 제대로 남들과 공유할 수 있는 사람이 일류다. 데이터 과학의 목적은 자기만족이 아니다. 성과를 나누는데 의미가 있다. 저널에 논문을 제출하든 콘퍼런스에서 발표를 하든 생각과 결과를 공유할 수 있어야 한다. 그러기 위해서 명쾌한 발표자료나 글쓰기가 필요하다. 영화에 종종 등장하는 골방에 처박혀서 컴퓨터만 하는 그런 천재의 모습이 내가 생각하는 데이터 과학자의 모습과는 거리가 멀다. 물론 때론 내가 그런 천재였으면 좋겠다는 생각을 안 해본 것은 아니지만, 소통의 능력이 데이터 과학자가 최후에 갖게 될 필살기다. (** 단, 그저 말발로 남을 현혹하는 부류는 잘 걸러내야 한다.)

위에 적은 논리적으로 생각하고 표현하는 법을 기른다는 건 그냥 이 글을 적기 위해서 합리화한 구실이고, 내가 멘티에게 글쓰기 연습을 강조하려던 이유는 어쩌면 따로 있는 듯하다. 물론 나도 허술한 점이 많은 완벽한 사람이 아니다. 그럼에도 나의 영향을 받은 사람들은 좀 더 완벽했으면 하는 바람(?) 또는 강박이 있는 듯하다. 내가 가르친 친구들이 딴 데 가서 욕먹는 건 내가 욕먹는 거랑 비슷한 수치감을 느낄 것 같다. 그래서 내 멘티는 작은 부분에서도 좀 더 발전하고 완벽했으면 하는 바람이 있었던 것 같다. 그 작은 것 중에 하나가 바로 글쓰기였다. 내 욕심을 채우기 위해서 인생에 약이 되는 조언이랍시고 괜히 꼰대 짓을 할 뻔했다. 여전히 그 친구의 인턴 포기가 매우 아쉽지만, 이 일을 통해서 스스로를 잠시나마 돌아볼 수 있었다. 앞으로 바뀔지는 두고 볼 일이지만... 

유퀴즈의 편집본을 유튜브에서 하나 보는데 '좋은 글에는 순서가 있다'는 얘기를 들었다. 마침 글쓰기에 관한 글을 적는데 적절한 타이밍에 저 문구가 내게 왔다. 모든 글의 순서는 각기 다르겠지만 바른 순서가 있는 글이 좋은 글이다. 아주 우연히 순서가 만들어지기도 하고 어떤 천재들은 그냥 본능적으로 순서를 만들어내기도 하지만, 나와 같은 범인들은 (좋은) 순서를 찾기 위해서 끊임없이 노력해야 한다. 그런 노력이 마침 나의 직업인 데이터 과학과도 일맥상통해서 다행이다. 나 자신의 의를 보이기 위해서 글을 적었지만 그게 나를 여러모로 연습하게 만들었다. 때론 데이터 과학 관련 지식을 체계적으로 정리하는데 도움을 주기도 했고, 아직은 쪼렙이지만 그래도 이런 글을 통해서 몇몇의 독자들에게 연결되기도 했다. 산만한 아이들에게 서예를 가르치듯 나는 글쓰기를 통해서 스스로 훈련되고 있었다. 글을 쓴다고 해서 모두 같은 경험을 하는 것은 아니겠지만 글쓰기는 독서와는 다른 카타르시스를 준다. 그냥 존재로서 글쓰기를 모두 했으면 좋겠다.

 

==

아직 멘붕에서 완전히 빠져나온 것은 아니지만 스스로를 되돌아보는 좋은 기회였다. 마치 혼자서 사랑하다가 혼자서 이별하고 혼자서 아파하는 듯한 경험이었다. 어쩌면 직접 하기 귀찮은 일을 떠넘기려다가 파투 나서 심술을 부렸던 건지도 모르겠다. 그럼에도 반성의 기회였다. 내가 그 친구에게 최고의 멘토다라는 일종의 자만을 반성했고 (물론 여전히 내가 마음만 먹으면 최고의 데이터 과학자를 키워낼 수 있다고 자신하고 이번이 마음을 먹은 그 순간이었는데 ㅎㅎ), 스스로 아직은 부족하다는 것 그럼에도 더 노력하지 않은 나태를 반성했다. 어쩔 수 없이 인턴 과제로 준비했던 문제를 직접 해결하면서 막연한 심리적 장애물을 몇 개 넘고 있다. 데이터 과학자로서도 한 단계 발전한 듯해서 혼자서 뿌듯해하고 있다. '잘했어.'

인턴을 포기한다는 톡이 왔을 때 이유도 묻지 않았고 잡지도 않았다. 그냥 어떤 마음이었는지 이해가 갔다. 어쩌면 그게 한번 잡아달라는 신호였던 걸까? 고민 중에 도움을 구했다면 좋은 말로 구워삶았겠지만, 오랜 고민 끝에 내린 결론에 괜히 더 혼란을 주고 싶지 않았다. 정규직 전환 가능성이 최소 8~90%라는 확신 정도는 줄 수 있었지만, 그 외에 연봉을 더 높여준다거나 수행할 과제/업무를 바꿔준다거나 그런 건 내 선에서 할 수 없는 거다. 불확실 미래에 대한 불안감이 무엇인지를 잘 알기에 다시 생각해보라는 말을 차마 못 꺼냈다. 결심을 했으니 그 결과는 스스로 책임질 테고, 어쨌든 나는 그 친구가 다른 곳에서 더 성장했으면 하는 바람이다. 성과를 내야 하는 때가 있듯 성장해야 하는 시기도 있다. 20대는 성장해야 할 때다. 어떤 결정이든 각자가 행복했으면 한다.

반응형