본문 바로가기

전체 글

(1181)
면접 과제 II 이전 글에서 원활한 진행과 바른 평가를 위해서 인터뷰 과제를 제시하곤 한다고 했다. 다양한 종류의 과제가 가능하겠지만, 본인이 참여한 인터뷰에서는 다음의 3가지 유형의 과제가 많았다. 예시 데이터와 함께 문제 상황을 설명하고 이를 어떻게 해결할지를 묻는 유형 제공된 데이터를 분석하거나 제시된 알고리즘을 구현하는 유형, 그리고 현업에 적용한 논문을 읽고 리뷰하는 유형 논문 리뷰 유형은 이전 글에서 자세히 적었고, 이번 글은 앞 두 유형에서 공통적인 걸 설명한다. 간혹 특정 기계학습 알고리즘을 특정 언어로 구현하라는 과제가 있을 수도 있으나, 문제 해결 방법을 요구하는 과제들은 '이것만이 정답이다'라는 그런 것이 없다. 다만 문제를 얼마나 포괄적으로 이해해서 다양한 시각으로 접근했는지를 보기를 원한다. 결론..
인터뷰: 논문 과제 이력서에 적힌 경력 사항과 자기소개 글만으로 지원자를 평가하거나 면접을 진행하기에는 부족한 점이 많다. 특히 석박사 학위조차도 없는 경력이 전무한 지원자나 회사 경력이 1~2년으로 짧아 수행한 프로젝트 실적이 별로 없는 경우는 제대로 판단할 수 없을뿐더러 때론 적당한 질문 거리를 찾지 못해서 면접이 매끄럽지 못한 경우가 종종 있다. 경력이 전무한 경우 인턴/수습이라는 안전장치를 마련하기도 하지만 면접보다는 조금 나을 뿐 2~3개월 동안 수행한 인턴 과제만으로 온전히 평가하기는 여전히 힘들거니와 -- 다소 부족한 경우 -- 한 번 같이 일한 친구를 과감히 탈락시키는 것도 때론 힘들다. 업무와 거리가 먼 신변잡기를 묻는 것도 공식 인터뷰에서 적절치 않다. 물론 내 기준으로 합격선을 통과한 경우 다소 가벼운 ..
데이터 과학자의 취준 (자기소개와 면접) ** 주의: 현재 속해있는 조직 (회사, 팀)의 공식 정책/방향/입장이 아니다. 순전히 개인 의견이다. 데이터 과학자 채용을 위한 개별 인터뷰 질문 별로 언젠가는 글을 적기는 해야겠지만, 오늘은 지난 몇 년 동안 인재 영입 과정으로 서류를 검토하고 면접에 참여하면서 공통적으로 느낀 아쉬움에 관해서 적는다. 데이터 과학자뿐만 아니라 다른 개발 직군도 글에서 밝힌 것과 크게 다르지 않으리라 본다. 기획, 영업, 마케팅 쪽은 다소 다를 수도 있지만, 기본 원칙은 크게 차이가 없을 테니 독이 되지는 않을 거다. 제한된 경험이지만 백 명 넘는 지원자의 이력서를 검토했고 그중 수십 명은 직접 면접관으로 참여했다. 새로운 사람을 맞이하는 건 늘 설레기에 영입 시스템에 새로운 이력서가 등록되거나 면접 참석 요청이 오면..
데이터 과학자가 되고 싶어요. 데이터 과학의 스펙트럼이 워낙 다양해서 이것, 이것, 이것만 순서대로 하시면 됩니다 라고 말하기 어렵다. (구분이 좀 무의미하지만) 새로운 알고리즘 개발에 집중하는 연구자도 있고 다양한 문제 상황에서 알고리즘/기술을 적재적소에 활용하는 응용가도 있고 빠른 실행 속도나 쉬운 이용 등을 위해 코드 최적화에 뛰어난 프로그래머도 있고 때론 결은 조금 다르지만 데이터 과학/인공지능에 특화된 하드웨어를 개발하는 이들도 있다. 여러 분야를 두루두루 다 잘하는 만능/천재 데이터 과학자가 되면 좋겠지만...(ㅠㅠ) 일반인들이 흔히 생각하는 데이터 과학자를 가정하고 글을 적는다. 하지만 각자는 '나는 어떤 데이터 과학자가 되고 싶다'를 명확히 해서 테크트리를 밟았으면 하는 바람이다. 종종 비슷한 류의 질문을 받는데 다양한..
그래서 RIG가 뭔데? 다른 팀, 특히 데이터 과학과 무관한 개발자나 기획자들과 시스템/모델 개편에 관해서 회의할 때 예측 모델의 성능 평가는 RIG로 하겠다고 하면 '근데 RIG가 뭐예요?'라는 질문을 거의 매번 듣곤 한다. 그냥 예전부터 으레 사용하던 지표라서 그냥 RIG를 보면 된다는 생각을 가졌는데, 이걸 비전공자들에게 정확히 설명하기가 어려웠다. 그냥 모델의 정확도를 측정하는 지표예요 정도로 얼버무리고 회의를 끝낸다. 상대방도 굳이 RIG에 대해서 더 궁금해하는 것 같지 않은 눈치다. 설명하기도 힘들고 짧게 설명 듣고 바로 이해하기도 힘드니 대강 얼버무리는 게 서로에게 좋았다. 데이터 과학이나 머신 러닝을 오래 한 이들도 RIG라는 용어를 처음 들어보거나 알더라도 정확히 무슨 개념이고 어떻게 계산하는지 쉽게 설명하기 ..
전환 예측은 왜 어려운가? 달고나 19에서 불확실성이 과금 방식의 변화를 이끌었다고 설명했다. 광고주의 불확실성을 해소하기 위해서 전환 중심의 광고가 나올 수밖에 없지만, 플랫폼은 오히려 확실한 트래픽에서 불확실한 전환으로 전이됨으로써 큰 공경에 빠질 수 있다. 만약 플랫폼이 전환을 정확하게 예측할 수 있다면 광고주의 불확실성과 플랫폼의 불확실성을 모두 해소할 수 있다. 하지만 정확한 전환 예측이 어렵기 때문에 문제다. (노출 후) 클릭 (CTR)은 거의 정확히 예측하고 있으니 개념적으로 보면 (클릭 후) 전환 (CVR)도 쉽게 예측할 수 있으리라 오인할 수 있다. 이 글에선 왜 전환 예측이 어려운지 대략적으로 설명한다. 2018년도 If Kakao에서 발표한 슬라이드를 가져왔다. (참고로 상단의 Imp/Click/Conv 그림은..
어떤 유튜브 채널을 보면서 느낌 단상 다른 곳에 생각나는 대로 그냥 적은 글을 가져옴. === 최근에 본 조금 흥미로운 유튜브 채널 중에 하나는 MBC(?)에서 운영하는 '오느른'이란 채널이다. - https://www.youtube.com/channel/UCqOmWSVk2LChbt15-Ie2tiw 이걸 MBC에서 운영한다고는 적었지만 MBC 소속의 한 PD가 전북 김제에 폐가/농가를 구입해서 고쳐서 사는 모습을 vlog로 담은 채널이다. MBC에서 기획한 것도 아니고 순전히 PD 개인이 구입한 건데 처음엔 고치는 과정을 vlog로 찍어서 올리겠다는 회사에 허락을 받고 주말에만 내려갔는데 어느 순간부터 구독자가 늘어나면서 그리고 수리 비용이 늘어나면서 서울 전셋집을 빼서 수리비에 보태고 회사에서는 소속을 바꾸고 그냥 김제에 눌어붙어살면서 v..
2020년 카드 사용 내역 정리 아침에 연말 정산을 했습니다. 예전보다 점점 더 편해집니다. 국세청에서 서류를 다운로드하고, 기부금 영수증은 사진으로 찍어서 시스템에 등록하면 끝납니다. 교회 헌금 (십일조)를 시골 고향 교회로 보내기 때문에 정산 철이 되면 매번 전화해서 왜 빨리 안 보냈냐고 성화였는데, 이젠 그냥 사진 파일로 받아서 그걸 첨부하기만 하면 됩니다. 예전에는 작성한 서류로 모두 프린트해서 사인 또는 도장으로 서명해서 제출했는데, 이젠 그런 불필요한 작업을 하지 않아서 더 편해졌습니다. 이렇게 우리 삶은 온라인에서 편해지고 있는데 여전히 불편한 곳도 많습니다. 늘 연망 정산을 할 때면 지난 1년 동안 사용한 카드 내역을 정리하는 시간을 갖았습니다. 매번 카드를 사용할 때마다 아끼려고 노력하고 그리고 매달 카드값을 갚을 때마..