본문 바로가기

데이터 시각화

(3)
[사이트] 트윗핑 TweetPing Wired에 재미있는 사이트가 하나 소개되었습니다. (Wired 기사 링크) Tweetping이라는 서비스입니다. 이름 (Tweet + Ping)이 의미하듯이 전세계에서 올라오는 트윗의 활동성을 실시간으로 분석해서 보여주는 서비스입니다. 지역별로 트윗수나 단어수, 최근에 사용한 해쉬태그 등을 보여줍니다. 기능면에서는 특별할 것도 없지만, 이렇게 트위터의 활동성을 시각화해서 보여준다는 아이디어가 참 좋습니다. 이정도 데이터라면 빅데이터 플랫폼을 이용했을 법하고, 하단에 명시되었듯이 Node.js 등의 최근에 많이 사용하는 오픈소스를 사용해서 보여주고 있습니다. 2013년 2월 4일 (월요일), 오후 2시경에 화면을 캡쳐했는데, 트윗의 절반 이상이 북미 (NA)에서 발생하고 있다는 것도 바로 확인할 수 있습..
빅데이터 분석을 위해 알아야할 것들 지난 글에서 (빅데이터) 분석 플랫폼에 대한 생각을 적었습니다. (참고. 데이터 분석 플랫폼에 대한 고민) 그냥 잊어버리려했지만 계속 머리 속에서 생각이 더 구체화되고 있습니다. '아키텍트가 필요하다' 글에서도 밝혔듯이 현실적으로 어려운 여건들이 많이 있지만, 전체 퍼즐을 완성하기 전에 부분 그림은 맞출 수 있을 것같다는 느낌이 옵니다. 데이터를 준비하는 과정은 서비스나 도메인에 따라서 최적화시켜야하는 부분이어서 지금 시점에서 구체적인 안을 제시할 수가 없고, 또 분석된 결과를 해석해서 더 가치있는 인사이트로 전개하는 것은 단기간에 해결될 수 있는 것도 아닙니다. 그리고 빅데이터를 위한 하드웨어 및 소프트웨어 인프라를 설계하고 개발하는 것도 제 영역/능력을 벗어난 일입니다. 그렇다면 현시점에서 당장 할 ..
데이터 시각화 도구들 최근에 빅데이터가 주목을 받고 있습니다. 보통 빅데이터는 하드웨어 인프라 영역, 소프트웨어 인프라 영역, 빅데이터 분석 영역, 빅데이터 서비스화 영역으로 나뉠 수 있습니다. 인프라 영역은 저의 관심 및 전문 분야가 아닙니다. 지금 당장은 갖춰진 인프라를 이용해서 몇 가지 단순한 분석업무를 더 빠르고 안정적으로 할 것인가?에만 중점을 두고 있지만, 더 장기적인 관점에서는 그런 분석결과를 서비스에 어떻게 이용할 것인가?가 더 관심이 갑니다. 빅데이터를 서비스에 접목하기에 앞서서 필요한 작업이 분석된 결과를 가지고 관련된 기획자나 개발자들을 설득하는 과정이 필요합니다. 그렇기 위해서 다양한 결과 리포팅 기술이 크리티컬합니다. 다양한 수치와 글로써 된 기획서나 뜬 구름잡는 듯한 개념도를 가지고 관련된 사람들을 ..