본문 바로가기

데이터마이닝

(21)
데이터 시각화 도구들 최근에 빅데이터가 주목을 받고 있습니다. 보통 빅데이터는 하드웨어 인프라 영역, 소프트웨어 인프라 영역, 빅데이터 분석 영역, 빅데이터 서비스화 영역으로 나뉠 수 있습니다. 인프라 영역은 저의 관심 및 전문 분야가 아닙니다. 지금 당장은 갖춰진 인프라를 이용해서 몇 가지 단순한 분석업무를 더 빠르고 안정적으로 할 것인가?에만 중점을 두고 있지만, 더 장기적인 관점에서는 그런 분석결과를 서비스에 어떻게 이용할 것인가?가 더 관심이 갑니다. 빅데이터를 서비스에 접목하기에 앞서서 필요한 작업이 분석된 결과를 가지고 관련된 기획자나 개발자들을 설득하는 과정이 필요합니다. 그렇기 위해서 다양한 결과 리포팅 기술이 크리티컬합니다. 다양한 수치와 글로써 된 기획서나 뜬 구름잡는 듯한 개념도를 가지고 관련된 사람들을 ..
(빅) 데이터 마이너가 되고 싶어요. 트위터를 통해서 질문을 받았습니다. 그 질문에 대한 답장을 보냈습니다. 앞으로 데이터마이닝 및 빅데이터 분석에 관심이 있는 이들이 많이 있을 것같아서 그 내용을 그냥 옮겨 적습니다.질문. 저는 XX대학교 정보통계학과 2학년 재학중인 학생입니다. 통계학을 전공하고 있는 저로서는 Data Philosopher가 저의 이상이라 생각이 들었습니다. 무엇을 어떻게 준비해야 경쟁력이 생길까요..? 빅데이터시대에 데이터 분석가로서의 자질을 갖추기 위해서는 어떠한 것들을 준비해야할지 여쭙고 싶습니다. (개인정보 및 부가적인 부분은 삭제했습니다.)답변. 저의 이전 글들도 읽어보셨는지 모르겠지만 (데이터마이닝 카테고리), 저의 학문적인 백그라운드는 데이터마이닝과 거리가 있고 회사에서는 데이터마이닝팀에 속해있지만 현업에서의..
데이터마이닝과 데이터마이너. 이 글은 아주 간단한 의문에서 시작했습니다. 고민에 고민을 거듭하고 생각에 생각을 더하다보니 애초의 질문과는 다른 방향으로 생각이 진행되었습니다. 아직 명확한 결론에 이르지는 않았습니다. 그리고 이 글을 전개하면서 또 어떤 모르는 힘에 의해서 글이 쓰여질지도 모르겠습니다. 최초의 의문은 "우리는 간단한 데이터에서 충분한 정보를 얻고 있는가?"입니다. 먼저 저는 다음 커뮤니케이션의 데이터마이닝팀에 속해있습니다. 당연히 업무는 검색 및 포털 서비스를 위한 데이터분석입니다. 입사한지도 4년이 지났는데 (오는 일요일인 3월 11일이면 5년째를 시작합니다.) 그동안 저 다음으로 입사해서 먼저 퇴사한 (예정된) 사람만 벌써 4명에 이릅니다. 그들의 공통된 지적은 '우리가 하는 일은 데이터마이닝이 아니다'입니다. 그..
검색경험과 키워드관리에 대한 짧은 생각 데이터마이닝 워크샵이 있었습니다. 이번 워크샵에서는 팀원 모두 짧은 발표를 하기로 했습니다. 새로 마이닝팀에 합류하신 분들은 자기소개자료를 준비하셨고, 기존 멤버들은 각자 하고 있는 업무 또는 관심분야 등에 대해서 자유롭게 발표를 했습니다. 저는 그동안 검색서비스를 위해서 필요했지만 중요도가 떨어져서 임기응변식으로 대응하던 키워드 관리에 대한 짧은 생각을 정리해서 발표했습니다. 아래에 발표자료를 공유합니다. 죄송하지만 자세한 설명은 생략할 수 밖에 없습니다. Minority Report about Search Experience & Keyword Management View more presentations from Buhwan Jeong.
슈퍼클런처 Super Crunchers, by Ian Ayres 3.5 / 5 데이터마이닝/데이터분석및적용의 인트로덕션으로는 좋으나 내 기대는 완전히 충족시키지 못했다. 슈퍼크런처 카테고리 경제/경영 지은이 이언 에어즈 (북하우스, 2009년) 상세보기 책에 대해서... 한마디로 표현해서 무조건 전문가의 (오류를 내포한) 직관에만 의존하지 말고, 데이터에서 밝혀진 검증된 결과도 함께 활용하라 정도로 요약할 수 있을 듯하다. 수학이나 데이터 분석에 별관심이 없었거나 비전공자라면 이런 방법이 있구나라고 생각할 수 있겠지만, 사실 책에서 말하는 것은 회귀분석, DOE (Design of Experiments 또는 Experimental Design) 중에서 Random Sample, 좀더 나아가서 신경망 Neural Network, 평균과 표준편차, 그리고 베이지언 확률 ..