본문 바로가기

DM ML AD

(131)

이 광고가 왜 내게? 한 달 동안 글이 없어서 이번에는 수많은 광고들 중에서 왜 이 광고가 지금 내게 노출됐고 또는 어떤 광고는 노출되지 않았는지에 관해서 가볍게 적는다. 기술적으로 어떤 과정을 거치고 어떤 알고리즘이 적용됐는지는 배제하고 적당히 상식선에서의 광고가 선택되는 이유를 적는다. (더 자세한 기술적인 얘기는 이전 글 참조. https://brunch.co.kr/@jejugrapher/216) 회사마다 광고 랭킹 로직은 다소 차이가 있지만 가장 공통적이고 기본이 되는 것은 eCPM이다. eCPM에 관해서는 언젠가 다시 다룰 기회가 있을 거고, 오늘은 정성적인 내용을 다룬다. 평소 인터넷 사용자로서 왜 이 광고가 지금 노출됐을까?를 궁금했던 분들의 이해를 돕기 위한 글이다. 복잡/자세한 건 모두 배제하고 개념적으로 설..

면접 과제 II 이전 글에서 원활한 진행과 바른 평가를 위해서 인터뷰 과제를 제시하곤 한다고 했다. 다양한 종류의 과제가 가능하겠지만, 본인이 참여한 인터뷰에서는 다음의 3가지 유형의 과제가 많았다. 예시 데이터와 함께 문제 상황을 설명하고 이를 어떻게 해결할지를 묻는 유형 제공된 데이터를 분석하거나 제시된 알고리즘을 구현하는 유형, 그리고 현업에 적용한 논문을 읽고 리뷰하는 유형 논문 리뷰 유형은 이전 글에서 자세히 적었고, 이번 글은 앞 두 유형에서 공통적인 걸 설명한다. 간혹 특정 기계학습 알고리즘을 특정 언어로 구현하라는 과제가 있을 수도 있으나, 문제 해결 방법을 요구하는 과제들은 '이것만이 정답이다'라는 그런 것이 없다. 다만 문제를 얼마나 포괄적으로 이해해서 다양한 시각으로 접근했는지를 보기를 원한다. 결론..

인터뷰: 논문 과제 이력서에 적힌 경력 사항과 자기소개 글만으로 지원자를 평가하거나 면접을 진행하기에는 부족한 점이 많다. 특히 석박사 학위조차도 없는 경력이 전무한 지원자나 회사 경력이 1~2년으로 짧아 수행한 프로젝트 실적이 별로 없는 경우는 제대로 판단할 수 없을뿐더러 때론 적당한 질문 거리를 찾지 못해서 면접이 매끄럽지 못한 경우가 종종 있다. 경력이 전무한 경우 인턴/수습이라는 안전장치를 마련하기도 하지만 면접보다는 조금 나을 뿐 2~3개월 동안 수행한 인턴 과제만으로 온전히 평가하기는 여전히 힘들거니와 -- 다소 부족한 경우 -- 한 번 같이 일한 친구를 과감히 탈락시키는 것도 때론 힘들다. 업무와 거리가 먼 신변잡기를 묻는 것도 공식 인터뷰에서 적절치 않다. 물론 내 기준으로 합격선을 통과한 경우 다소 가벼운 ..

데이터 과학자의 취준 (자기소개와 면접) ** 주의: 현재 속해있는 조직 (회사, 팀)의 공식 정책/방향/입장이 아니다. 순전히 개인 의견이다. 데이터 과학자 채용을 위한 개별 인터뷰 질문 별로 언젠가는 글을 적기는 해야겠지만, 오늘은 지난 몇 년 동안 인재 영입 과정으로 서류를 검토하고 면접에 참여하면서 공통적으로 느낀 아쉬움에 관해서 적는다. 데이터 과학자뿐만 아니라 다른 개발 직군도 글에서 밝힌 것과 크게 다르지 않으리라 본다. 기획, 영업, 마케팅 쪽은 다소 다를 수도 있지만, 기본 원칙은 크게 차이가 없을 테니 독이 되지는 않을 거다. 제한된 경험이지만 백 명 넘는 지원자의 이력서를 검토했고 그중 수십 명은 직접 면접관으로 참여했다. 새로운 사람을 맞이하는 건 늘 설레기에 영입 시스템에 새로운 이력서가 등록되거나 면접 참석 요청이 오면..

데이터 과학자가 되고 싶어요. 데이터 과학의 스펙트럼이 워낙 다양해서 이것, 이것, 이것만 순서대로 하시면 됩니다 라고 말하기 어렵다. (구분이 좀 무의미하지만) 새로운 알고리즘 개발에 집중하는 연구자도 있고 다양한 문제 상황에서 알고리즘/기술을 적재적소에 활용하는 응용가도 있고 빠른 실행 속도나 쉬운 이용 등을 위해 코드 최적화에 뛰어난 프로그래머도 있고 때론 결은 조금 다르지만 데이터 과학/인공지능에 특화된 하드웨어를 개발하는 이들도 있다. 여러 분야를 두루두루 다 잘하는 만능/천재 데이터 과학자가 되면 좋겠지만...(ㅠㅠ) 일반인들이 흔히 생각하는 데이터 과학자를 가정하고 글을 적는다. 하지만 각자는 '나는 어떤 데이터 과학자가 되고 싶다'를 명확히 해서 테크트리를 밟았으면 하는 바람이다. 종종 비슷한 류의 질문을 받는데 다양한..

그래서 RIG가 뭔데? 다른 팀, 특히 데이터 과학과 무관한 개발자나 기획자들과 시스템/모델 개편에 관해서 회의할 때 예측 모델의 성능 평가는 RIG로 하겠다고 하면 '근데 RIG가 뭐예요?'라는 질문을 거의 매번 듣곤 한다. 그냥 예전부터 으레 사용하던 지표라서 그냥 RIG를 보면 된다는 생각을 가졌는데, 이걸 비전공자들에게 정확히 설명하기가 어려웠다. 그냥 모델의 정확도를 측정하는 지표예요 정도로 얼버무리고 회의를 끝낸다. 상대방도 굳이 RIG에 대해서 더 궁금해하는 것 같지 않은 눈치다. 설명하기도 힘들고 짧게 설명 듣고 바로 이해하기도 힘드니 대강 얼버무리는 게 서로에게 좋았다. 데이터 과학이나 머신 러닝을 오래 한 이들도 RIG라는 용어를 처음 들어보거나 알더라도 정확히 무슨 개념이고 어떻게 계산하는지 쉽게 설명하기 ..

전환 예측은 왜 어려운가? 달고나 19에서 불확실성이 과금 방식의 변화를 이끌었다고 설명했다. 광고주의 불확실성을 해소하기 위해서 전환 중심의 광고가 나올 수밖에 없지만, 플랫폼은 오히려 확실한 트래픽에서 불확실한 전환으로 전이됨으로써 큰 공경에 빠질 수 있다. 만약 플랫폼이 전환을 정확하게 예측할 수 있다면 광고주의 불확실성과 플랫폼의 불확실성을 모두 해소할 수 있다. 하지만 정확한 전환 예측이 어렵기 때문에 문제다. (노출 후) 클릭 (CTR)은 거의 정확히 예측하고 있으니 개념적으로 보면 (클릭 후) 전환 (CVR)도 쉽게 예측할 수 있으리라 오인할 수 있다. 이 글에선 왜 전환 예측이 어려운지 대략적으로 설명한다. 2018년도 If Kakao에서 발표한 슬라이드를 가져왔다. (참고로 상단의 Imp/Click/Conv 그림은..

논문읽기 My Style of Reading Papers 다른 분야도 비슷하겠지만 데이터 과학, 머신러닝 및 인공지능 관련 연구/업무를 하다 보면 논문을 읽어야 할 때가 종종 있다. 단순히 최신 동향이나 기술을 익히기 위함도 있지만, 새로운 분야, 문제, 데이터를 만날 때마다 기존의 지식, 경험, 휴리스틱만으론 부족하거나 해결하지 못하는 경우가 있다. 잘 정리된 텍스트북이 있으면 좋겠지만 업데이트/리비전에 시차가 있어서 최신 기술이나 문제를 다루지 못하는 경우도 많다. 뿐만 아니라 텍스트북은 그 분야 전체를 종합적으로 다루는 경향이 있어서 당장 알고 싶은 내용이 부실하거나 책의 여러 파트에 쪼개져 기술돼있어서 빠르게 기술을 습득하기 어렵기도 하다. 물론 처음부터 끝까지 완독 하면 좋겠지만... (ㅠㅠ) 어렴풋이 알고 있는 개념을 확인하기 위해서 예전에 읽은 책..

이전 1 ··· 4 5 6 7 8 9 10 ··· 17 다음

티스토리툴바