본문 바로가기

Messages from Bahn

(1184)
[상담] 데이터과학 대학원에 가고 싶은데 어떻게 하면 좋을까요? 아래처럼 (제가 요약한 것임) 현재 의용공학 4학년생의 고민글을 페메로 받았습니다. 원하는 바를 짧게 해결해줄 수는 없겠지만 나름 제 생각을 적겠습니다. 순전히 저의 개인적인 경험과 지식을 바탕으로 적는 글이니 각자의 상황에 맞게 취사선택하기 바랍니다. 의용공학과 4학년생입니다. 졸업과제로 질병 발생 예측 분석을 하면서 데이터과학에 관심을 갖게됐습니다. 확률통계는 수강했고 코딩은 원래 좋아해서 분석 프로그래밍에 별 어려움은 없습니다. 1년 정도 유급해서 통계, 분석 과목을 더 수강해서 학사 학점을 높여 대학원에 진학하고 싶습니다. 학교 경영학과에 데이터마이닝을 하는 연구실이 있다고 해서 알아보고 있고, 현재 학점으로 다른 학교 대학원에 진학할 수 있을지 의문입니다. 학교 내에 적당한 연구실/교수님이 없다..
데이터 과학자를 준비하는 이들에게 주는 실질적 조언 Practical Advices for Future Data Scientists 전공자에게도 다소 도움은 되겠지만 비전공자를 위한 글이다. 이미 데이터 과학자를 양성하는 커리큘럼/학과 (수학, 통계, 컴공/컴사, 폭을 넓히면 산공, 전자 등)에서 공부하는 재학생이나 졸업생, 또는 그런 학과로 진학을 모색하는 고등학생을 위한 글이 아니란 의미다. 정식으로 데이터 과학 과정을 이수하지 못한 비전공자들, 특히 이미 졸업해서 (동영상 강의 외에) 관련 학과 수업도 듣기 어려운 이들을 위한 글이다. 주변 도움과 조언 없이 데이터 과학자가 되려니 어떻게 준비해야 할지 막막해하는 이들을 위한 주제넘은, 그렇지만 현실적이고 실질적인 조언을 적는다. 다소 무리한 조언일 수도 있지만, 반드시 이루겠다는 의지가 있다면 그리..
그냥 파괴하는 스타트업 Just Destroying ‘혁신’과 가장 밀접한 단어는 ‘창조’ 또는 ‘창의’지만, 의외로 그 반대 단어인 ‘파괴’ 또는 ‘와해성’과 함께 사용된다. 슘페터, 크리스텐슨 등의 유명한 학자들이 내세운 창조적 파괴 (innovative destruction), 파괴적 혁신 disruptive innovation, 와해성 기술 disruptive technology 등의 용어 때문에 창조적 혁신보다 파괴적 혁신이란 표현이 더 익숙하다. 혁신은 곧 창조이며 파괴다. 그래서 창조성과 파괴성은 다르지만 같다. 기존의 질서 또는 프레임을 무너뜨리지 않고 새로운 질서와 프레임을 구축할 수 없다. 그런 무너뜨림의 과정, 즉 파괴 이후에 새로운 창조가 있는 법이다. 무너뜨림이 없는 발전을 보통 개선이라고 부른다. 어쨌..
아인슈타인과 데블스 애드보캇 산업공학을 전공해서 지금은 데이터마이닝을 업으로 삼고 있지만 고등학교 때까지는 물리학을 전공하고 싶어했습니다. 그때까지 알던 물리는 뉴턴이 정립한 고전물리였지만 나름 물리에 일가견있었습니다. 믿거나 말거나. 최근 양자역학, 상대성이론, 초끈이론, 천체과학 등의 현대물리에 관한 책을 여럿 읽고 있습니다. 깊은 내용을 다룬 것이 아니라, 역사와 주요 인물들의 업적 (또는 전기) 그리고 방향성을 개괄적으로 다룬 책들입니다. 안 하길 잘 했다는 생각이 듭니다. 어쨌든 현대물리가 제 업도 아니고 그냥 취미로 책을 읽어나가니 참 재미있습니다. 계속 했더라면 그들과 같은 천재의 반열까지는 아니더라도 이름을 알릴만한 업적을 남겼을까?라는 생각도 들고... 어쨌든 어렵지만 참 재미있는 학문입니다. 양자역학에 크게 기여했..
10년만에 10만원을 벌다 (2월 말에 사내 게시판에 적었던 글을 편집해서 올린다는 것을 계속 미루다가 이제야 적습니다. 2월말 시점입니다.) 어제 10만원을 벌었습니다. 정확히 말하면 2달 뒤에 통장에 10만원이 들어옵니다. 정확한 시점은 특정할 수 없지만 2006년 경에 학교에 있을 때 구글 애드센스 계정을 만들었습니다. 당시 학교 서버에 있는 개인 홈페이지에 애드센스를 붙이려 했지만 제대로 동작하지 않았고, 블로그스팟에는 애드센스가 잘 붙었지만 글도 많이 적지 않았고 무슨 허세였는지 블로그스팟에는 영어로만 글을 작성하기로 마음을 먹었기에 글 적는 회수가 가뭄에 콩나듯 적었습니다. 그러니 글수도 부족하고 깊이있는 (여전히 얕은 글만 적고 있지만) 글을 적지 못하니 찾아오는 사람들도 드물었습니다. 본격적으로 트래픽이 들어온 것은..
벤, 밥솥을 사다. 오랜만에 페이스북과 회사 게시판 (아지트)에 긴 글을 적으니 여러 사람들의 반응을 보였다. 평소에 좋아요나 댓글을 달지 않던 분들의 반응이라 더 신기했다. 밥솥을 구매한 얘기였는데, 어쩌면 사람들은 뭔가를 구매하는 것 (과정)을 좋아하는 듯도 하고 타인의 행위로 대리만족을 느끼는 것 같기도 하다. 이유가 뭐든 재밌는 경험이다. 비슷한 류의 글을 종종 적을까를 잠시 고민했지만 난 천성적으로 소비형 인간이 아니라서 그럴 기회는 더물 듯하다. 문득 스티브 잡스의 가족이 세탁기를 샀던 일화가 생각났다. (Steve Jobs buys a washing machine.) 그래서, 같은 글을 ‘벤, 밥솥을 사다’라는 제목으로 티스토리에 옮긴다 (Ben의 회사에서 이름). https://www.wired.com/200..
과학적 방법과 실험 설계 과학 이론을 정립하는 과정/방법은 크게 반복되는 관찰을 일반화해서 이론을 만드는 귀납법과 사고실험으로 구축된 이론을 가설검증과 재현실험을 통해서 확인하는 연역법이 있다. 그래서 지난 글에서 과학 또는 과학적 방법은 재현성과 반복성에 있다고 적었다. 오늘은 실험에 대해서 좀더 자세히 적으려 한다. 가설검증에서 자주 등장하는 개념이 '통계적 유의성 significant'이다. 이는 관측된 데이터가 어떤 분포를 따른다고 가정했을 때 두 분포가 통계적으로 같지 않음을 확인한다. 흔히 정규분포 (가우시안분포, N)를 따른다고 가정하고 자주 들었던 p-value라는 게 등장한다. 최근 들어 p-value에 대한 회의론이 많기는 하지만 여전히 과학적 방법 또는 통계적 유의성을 판별하는데 p-value는 (강력한) 필..
[Q&A] 개발팀인데 데이터 분석으로 성과를 내야하는 미션이 떨어졌습니다. 어느 기업에서 컴공/전자과 출신 8명으로 구성된 개발팀에 있습니다. 모두 데이터 지식이 전무합니다. 1. 모두 비전공자라서 수식이 아닌 개념과 실습 위주로 스터디를 하려 합니다. 좋은 방법일까요 아니면 다른 방법을 추천해주세요. 2. 리더없이 스터디가 잘 진행될까요? 온라인 강의를 함께 듣고 토의하면서 공부할 수 있을까요? 3. 속성으로 공부해서 최소 POC 구현정도라도 소기의 성과를 낼 수 있을까요? 4. 판교에서 Q&A를 진행해주실 수 있나요? (평일) 진로를 고민하는 비슷한 질문을 여럿 받았지만, 이번이 가장 상황이 좋아 봅입니다. 흔히 말하는 데이터 분석 또는 머신러닝을 배우고 적용하는에 필요한 3가지 중에 최소 2가지를 이미 갖췄습니다. 이미 회사에 속했기 때문에 도메인/비즈니스 지식과 데이터가..