본문 바로가기

DM ML AD

(131)
학과/전공에 따른 데이터마이닝 구분 최근 빅데이터 Big Data, 스마트 데이터 Smart Data, 데이터분석 Data Analytics, 예측분석 Predictive Analytics, 데이터 사이언티스트 Data Scientist 등과 같은 용어가 범람하는 것은 그만큼 데이터마이닝 Data Mining에 대한 수요와 인기가 높아졌다는 반증일 것입니다. 이전 글에서 데이터마이너가 되기 위해서 이런 학과에 진학하거나 수업을 들으면 된다는 류의 Q&A를 몇 차례 다뤘습니다. 일반적인 의미에서 그런 진학/진로 상담이 별로 어렵지는 않습니다. 하지만 세부적으로 들어가면 각 학과마다 조금씩 관점의 차이가 있기 때문에 단순히 이런 수업을 수강하면 된다 식의 조언으로는 충분치 못한 것같아서, 오늘은 학과/전공별로 데이터마이닝이 어떻게 다른지에 대..
[Q&A] 경제학과 학생의 데이터마이너 되기.? 경제학을 전공하는 1년차 대학생께서 데이터마이너가 되고 싶다는 문의를 해주셨습니다. 저와 백그라운드가 다른 쪽 (문과 계열)은 조금 조심스럽습니다. 제 경험이 아닌 상상에 맞춰서 — 그리고 어떤 면에서는 선입견에 따라서 — 불필요한 조언이 될 수도 있기 때문입니다. 지난 번에 문과 고등학생도 질문을 주셨지만, 그 분은 아직 대학/과를 정하지 않은 상태였고, 지금은 경제학과로 진학한 경우라서 조금 느낌이 다를 수 있습니다. 그리고 학교마다 개설되는 수업 이름이 다르기 때문에 정확한 수업명은 다시 확인하시기 바랍니다. 안녕하세요? 경제학과에 재학중인 학생입니다. 아직 1학년 밖에 마치지 않았지만 데이터마이너가 되고싶다는 생각이 들어 이렇게 여쭈어 보게 되었습니다. 구체적으로 어떤 과목을 공부해야하는지 알고 ..
[Q&A] 데이터 사이언티스트가 되고 싶은 학생입니다. 오랜만에 페이스북을 통해서 데이터 사이언티스트가 되고 싶은 학생의 고민상담이 들어와서 글을 적습니다. 질문을 요약하면 다음과 같습니다. 캠프에 참석했다가 다음소프트의 송영길 부사장의 발표를 보고 데이터 사이언티스트가 되고 싶어졌다. (범죄예약이나 사회정책 등) 주어진 문제를 다각도로 조사 이해해서, 이를 분석하고, 솔루션을 찾아내는 일을 하고 싶다. 빅데이터 연구센터 및 연구실 등을 고려해서 산업공학과에 진학하면 될 것같아서 준비해오고 있었다. 평소보다 수능성적이 낮게 나와서 지원했던 대학에서 좋은 결과를 얻지 못했다. 현재 성적으로는 중상위권 대학에서 장학금을 받으면서 입학도 가능하다. 재수를 해서 원하던 대학의 학과 (컴공으로 수정)로 진학하는 것이 나을까요? 지난 번의 문과학생의 진로고민이나 타대학..
문과생이 데이터마이너되기? 아래와 같은 질문이 들어왔습니다. 요약하자면, 현재 고등학교 문과생인데, 빅데이터 또는 데이터마이닝에 관심이 생겨서 이 분야로 진로/진학을 하고 싶은데 어떻게 하면 좋을까요?입니다. (전략) 지금 수시원서접수를 코앞에 둔 서울인문계고등학교 재학중인 문과 고3여학생인데, 글을 읽어보면 컴공을 추천하셨는데 문과에서는 현실적으로 가기 힘듭니다... 그렇다면 대안책으로 심리학과를 추천하시나요? 심리학보다는 통계학이 나을까요?(통계학이 문과에 있는 학교가 무척 제한적이고 그중엔 학부의 입시특성상 제가 지원하기 힘든 학교도 있어서, 다른과를 더 찾아보고 있습니다.) (중략) 만약 흥미로 이쪽 분야로 가려고 한다면 문과계열 중 어느학과를 추천하시고, 이후 어떤 식으로 공부해나가는걸 추천하시는지. 이런 막연한 환상섞인..
데이터마이닝을 전공하고 싶은데... 적고 싶은 글이 있었지만 일주일 넘게 글을 적지 못하고 있었는데, 페이스북에 누군가 데이터마이닝 전공에 대한 질문을 해봤길래 그 답변을 먼저 적습니다. 일전에도 '데이터마이너가 되고 싶어요'라는 글에서도 비슷한 답변을 해줬고, '데이터마이닝과 데이터마이너'라는 글에서도 좀 적었던 내용입니다. 그 외에도 몇 번 언급은 했던 것같은데 다시 질문에 맞게 글을 적습니다. 당장 어떤 내용이 적힐지 모르겠지만, 일부 내용은 일부에게 상처를 줄 수도 있습니다. 솔직한 답변을 위해서 냉혹한 현실을 그대로 말하려는 것이니 너른 이해를 바랍니다. (아래에 글을 편하게 적다보니 딱딱한 문체가 되었는데 바꾸기가 귀찮으니 그대로 놔두겠습니다. 이해바랍니다.) -- (질문) (전략) 22살 지방에서 학교를 다니다 휴학하고 공익근..
데이터마이너에 대한 소회 매주 화, 금요일을 기다렸던 이유는 윤태호님의 미생 때문이었는데, 지난주로 1부가 마감되었습니다. 그 빈자리를 이제 강풀님께서 '마녀'로 채워주셨고 그래서 이제는 월, 목요일을 기다리게 됩니다. 오늘 (어제) 연재된 9화 (만화속세상 마녀 9화) 에서 주인공이 전공을 살려서 데이터마이너가 되었다라는 표현이 등장합니다. 그래서 (아래처럼) 블로그 유입키워드로 '데이터마이너'가 급증했습니다.위의 티스토리 유입로그를 보면서 가장 먼저 떠오른 생각은 마녀는 다음 Daum의 만화속세상에서 연재 중인데, 검색쿼리는 네이버에서 대부분 발생했다는 점입니다. 단순히 네이버에서는 내 글을 잘 찾아줬고, 다음에서는 그러지 못했을 수도 있다는 생각을 할 수도 있지만, 아래의 캡쳐화면서 보여지듯이 네이버에서는 제 글이 3개가 ..
데이터 마이너의 판단 기준 데이터 마이닝의 좋은 점을 하나 꼽으라면 늘 새롭다는 거다. 새로운 도메인의 새로운 문제를 만나기도 하고, 늘 담당하던 서비스지만 새로운 출처의 데이터나 새로운 종류/포맷의 데이터를 만나기도 하고, 그도 아니면 새로운 알고리즘을 배우고 적용하기도 한다. 파라메터를 새롭게 추가하거나 내용을 변경하는 것만으로도 새로운 경험이 된다. 그래서 현재 업무가 지치거나 지루해지면 새로운 서비스를 담당하거나 새로운 데이터를 공급받거나 새로운 알고리즘을 적용하거나 등의 방법으로 매너리즘을 돌파하는 경우가 많다. 물론 이런 과정이 반복되면 새로운 문제가 전혀 새롭지도 않고 새로운 데이터도 전혀 새롭지도 않고 또 하늘 아래 새로운 알고리즘도 없는 것같은 무력감에 빠지지 않는다는 법도 없다. 어쨌든 데이터 마이닝은 늘 새로운..
빅데이터 시대는 갔다. VentureBeat의 기사를 읽고 글을 적습니다. (참고. Big data is dead. What's next?) 언제나 기술용어가 마케팅용어로 변하는 시점이 되면 죽음 death이라는 단어가 등장합니다. 마케팅의 탄생 시점이 늘 기술의 사망 시점과 묘하게 겹치는 것같다. 인터넷만 국한시켜 생각해보면, 한 때 웹2.0이 기술용어인가 마케팅용어인가를 두고 논쟁이 벌어졌습니다. 그런 논쟁은 기술이 번성하고 이제 마케팅이 시작되는 시점에 벌어졌습니다. 그리고 최근에는 소셜이 그런 과정을 거쳤고, 이제는 클라우드나 빅데이터가 같은 운면에 접어들었습니다. 늘 그랬습니다. Geek의 손을 떠난 새로운 제품/서비스는 결국 마케터들의 손에 전달됩니다. 그 순간 매번 기술의 죽음이 언급됩니다. 마케팅이야 말로 기술과..