본문 바로가기

DM ML AD

(134)
데이터 매니페스토 -- Make Data Open & Mining Public 사내 게시판에 올린 데이터 마이닝 학습 모임을 위한 글입니다. 모든 데이터는 공개가 원칙이고 마이닝 능력은 보편 지식이 돼야 합니다. === 모든 법의 존재 목적이 사문화돼 폐기되는 것이듯, 모든 조직의 존재 이유도 더 이상 필요의 이유가 사라지는 것이다. 스스로 파괴해서 증식할 것이냐 아니면 파괴당해서 사라질 것이냐의 차이만 존재할 뿐 현재의 모습과 역할이 변해야 하는 것에는 전혀 변함이 없다. 데이터 또는 그것을 다루는 조직의 운명도 다르지 않다. 데이터는 더 이상 소수의 권력이 되어서는 안 되고, 그것을 읽고 해석하는 능력이 전문성이 되어서도 안 된다. 데이터 기반 조직 Data-driven organization이란 단순히 데이터/수치에 의해서 의사결정을 내리는 조직이 아니라, 구성원 모두가 나름..
[책소개] 초보자들을 위한 통계학습 (An Introduction to Statistical Learning with Applications in R) (한글 번역본 나옴. http://book.daum.net/detail/book.do?bookid=KOR9791186710050)연초부터 옆 팀에서 Kevin P. Murphy의 "Machine Learing: A Probabilistic Perspective"라는 책으로 스터디를 한다는 얘기를 들었다. 여러 이유로 제한된 일부를 제외하고는 타팀의 청강을 허용하지 않는다고 해서, 그냥 인터넷에서 책을 구해서 읽어나갔다. (구글링하면 PDF 파일을 얻을 수 있음.) 약 1000페이지의 방대한 양에 머신러닝과 관련된 -- 최근 핫한 이슈를 포함한 -- 대부분의 주제를 다루고 있어서 이것만 마스터하면 머신러닝에 조금 더 익숙해질 수 있으리라는 기대를 가지고 막무가내로 읽어나갔다. 그런데 양도 많지만 너무 어려..
데이터 매니페스토: 데이터 기반의 실행조직 (새벽에 문득 잠에서 깨어 이 글을 적는다.) 최근 데이터 또는 데이터 기반 접근법에 대한 관심이 뜨겁다. 어쩌면 내가 밥벌어먹고 살려고 또 내 몸값을 올리려고 이런 표현을 사용/전파하고 있는지도 모르겠다. 관련 뉴스를 보면서 과연 데이터 기반의 실행조직이라는 것이 실체가 있는 것인지? 아니면 그들도 자기들을 세일즈하기 위해서 억지로 기사를 쏟아내고 있는 것은 아닌지? 또는 구글이나 몇몇 잘 나가는 기업들이 데이터를 가지고 돈을 잘 벌고 있으니 그걸 부각시키고 과대포장하고 있는 것은 아닌지? 등에 대한 의문이 들기는 한다. 그런 의심은 일단 뒤로 하고, 데이터가 공기처럼 편재하고 있다는 것은 사실이다. 많은 기업들이 스스로 좀 더 가치있는 데이터를 생산해내거나 고객들로부터 그런 데이터를 수집하려고 노력중..
학과/전공에 따른 데이터마이닝 구분 최근 빅데이터 Big Data, 스마트 데이터 Smart Data, 데이터분석 Data Analytics, 예측분석 Predictive Analytics, 데이터 사이언티스트 Data Scientist 등과 같은 용어가 범람하는 것은 그만큼 데이터마이닝 Data Mining에 대한 수요와 인기가 높아졌다는 반증일 것입니다. 이전 글에서 데이터마이너가 되기 위해서 이런 학과에 진학하거나 수업을 들으면 된다는 류의 Q&A를 몇 차례 다뤘습니다. 일반적인 의미에서 그런 진학/진로 상담이 별로 어렵지는 않습니다. 하지만 세부적으로 들어가면 각 학과마다 조금씩 관점의 차이가 있기 때문에 단순히 이런 수업을 수강하면 된다 식의 조언으로는 충분치 못한 것같아서, 오늘은 학과/전공별로 데이터마이닝이 어떻게 다른지에 대..
[Q&A] 경제학과 학생의 데이터마이너 되기.? 경제학을 전공하는 1년차 대학생께서 데이터마이너가 되고 싶다는 문의를 해주셨습니다. 저와 백그라운드가 다른 쪽 (문과 계열)은 조금 조심스럽습니다. 제 경험이 아닌 상상에 맞춰서 — 그리고 어떤 면에서는 선입견에 따라서 — 불필요한 조언이 될 수도 있기 때문입니다. 지난 번에 문과 고등학생도 질문을 주셨지만, 그 분은 아직 대학/과를 정하지 않은 상태였고, 지금은 경제학과로 진학한 경우라서 조금 느낌이 다를 수 있습니다. 그리고 학교마다 개설되는 수업 이름이 다르기 때문에 정확한 수업명은 다시 확인하시기 바랍니다. 안녕하세요? 경제학과에 재학중인 학생입니다. 아직 1학년 밖에 마치지 않았지만 데이터마이너가 되고싶다는 생각이 들어 이렇게 여쭈어 보게 되었습니다. 구체적으로 어떤 과목을 공부해야하는지 알고 ..
[Q&A] 데이터 사이언티스트가 되고 싶은 학생입니다. 오랜만에 페이스북을 통해서 데이터 사이언티스트가 되고 싶은 학생의 고민상담이 들어와서 글을 적습니다. 질문을 요약하면 다음과 같습니다. 캠프에 참석했다가 다음소프트의 송영길 부사장의 발표를 보고 데이터 사이언티스트가 되고 싶어졌다. (범죄예약이나 사회정책 등) 주어진 문제를 다각도로 조사 이해해서, 이를 분석하고, 솔루션을 찾아내는 일을 하고 싶다. 빅데이터 연구센터 및 연구실 등을 고려해서 산업공학과에 진학하면 될 것같아서 준비해오고 있었다. 평소보다 수능성적이 낮게 나와서 지원했던 대학에서 좋은 결과를 얻지 못했다. 현재 성적으로는 중상위권 대학에서 장학금을 받으면서 입학도 가능하다. 재수를 해서 원하던 대학의 학과 (컴공으로 수정)로 진학하는 것이 나을까요? 지난 번의 문과학생의 진로고민이나 타대학..
문과생이 데이터마이너되기? 아래와 같은 질문이 들어왔습니다. 요약하자면, 현재 고등학교 문과생인데, 빅데이터 또는 데이터마이닝에 관심이 생겨서 이 분야로 진로/진학을 하고 싶은데 어떻게 하면 좋을까요?입니다. (전략) 지금 수시원서접수를 코앞에 둔 서울인문계고등학교 재학중인 문과 고3여학생인데, 글을 읽어보면 컴공을 추천하셨는데 문과에서는 현실적으로 가기 힘듭니다... 그렇다면 대안책으로 심리학과를 추천하시나요? 심리학보다는 통계학이 나을까요?(통계학이 문과에 있는 학교가 무척 제한적이고 그중엔 학부의 입시특성상 제가 지원하기 힘든 학교도 있어서, 다른과를 더 찾아보고 있습니다.) (중략) 만약 흥미로 이쪽 분야로 가려고 한다면 문과계열 중 어느학과를 추천하시고, 이후 어떤 식으로 공부해나가는걸 추천하시는지. 이런 막연한 환상섞인..
데이터마이닝을 전공하고 싶은데... 적고 싶은 글이 있었지만 일주일 넘게 글을 적지 못하고 있었는데, 페이스북에 누군가 데이터마이닝 전공에 대한 질문을 해봤길래 그 답변을 먼저 적습니다. 일전에도 '데이터마이너가 되고 싶어요'라는 글에서도 비슷한 답변을 해줬고, '데이터마이닝과 데이터마이너'라는 글에서도 좀 적었던 내용입니다. 그 외에도 몇 번 언급은 했던 것같은데 다시 질문에 맞게 글을 적습니다. 당장 어떤 내용이 적힐지 모르겠지만, 일부 내용은 일부에게 상처를 줄 수도 있습니다. 솔직한 답변을 위해서 냉혹한 현실을 그대로 말하려는 것이니 너른 이해를 바랍니다. (아래에 글을 편하게 적다보니 딱딱한 문체가 되었는데 바꾸기가 귀찮으니 그대로 놔두겠습니다. 이해바랍니다.) -- (질문) (전략) 22살 지방에서 학교를 다니다 휴학하고 공익근..