Share           Pin It

잔디밭에 새로운 길을 만드는 것에 대한 유명한 일화가 있다. 이게 실화인지 꾸며낸 이야기인지는 잘 모르겠다. 새로운 건물이 들어섰는데 기존 건물들과 연결하기 위해서 잔디밭에 새로운 길을 만들어야 했다. 그래서 어떤 경로로 만들면 가장 좋을지 고민하고 있는데, 누군가 '그냥 1년 동안 방치해 두세요'라고 조언해줬다. 그래서 그냥 방치해뒀더니 1년 뒤에 마법과 같이 잔디밭에 새로운 길이 생겼다고 한다. 한두명씩 잔디밭을 가로질러 건물로 가다보니 차츰 많은 이들이 통과한 곳에 자연스레 길이 만들어졌다고 한다. 그래서 그곳을 사람들이 통과하기 편하도록 길을 다듬었다고 하는 일화가 있다.

이 일화는 제품개발방법론을 설명할 때 종종 인용된다. 인위적으로 새로운 기능을 추가하지 말고 사용자들이 그 제품/서비스를 이용하는 패턴을 관찰했다고 개선하라는 메시지를 준다. 실제 이런 진화적 방법론을 통해서 많은 서비스들이 최적화되는 것을 목격한다. 그러나 이런 진화적 방법론은 덜 혁신적이라는 평을 받기도 한다. 창의적인 비저너리가 있으면 처음부터 사람들이 좋아할만한 길을 제시했을테고, 1년을 기다릴 필요가 없었다는 거다. 그러나 조직마다 그런 비저너리가 존재하는 것이 아니기 때문에 현실에서는 위의 진화적 또는 프랙티셔너 방법이 잘 먹힌다.

그런데 A와 B 사이의 길을 만들어야 한다는 것은 어떻게 알 수 있을까? 간혹 새로 확장된 도로를 드라이브할 때가 있다. 평소에는 돌아가던 길인데 새롭게 정비되어 시간도 많이 줄고 편하게 운전할 수가 있어서 좋다. 그런데 개통한지 시간이 꽤 지나도 차들이 많이 안 다니는 것을 보면 왜 굳이 세금을 들려가면서 이런 곳에 도로를 만들었을까?라는 생각도 한다. A와 B 사이의 새로운 도로를 내거나 정비해야할 필요성은 어떻게 알 수가 있을까? 다행히 그 통행로에 차들이 많이 몰려서 정체가 되면 당연히 새로운 길이 필요한 때다. 그런데 그렇지 않은 한적한 도로라면 어떻게 알 수 있을까? A와 B 사이의 우회도로를 만드는 이유는 C를 경유하는 기존의 도로들이 막히는 현상이 발생하기 때문에 A와 B 사이에 새로운 길을 만든다. A와 B를 연결하는 모든 C들의 통행량의 합이 임계치를 넘으면 A와 B 사이에 새로운 길 또는 확장을 해야 한다. 제품이나 서비스도 다른 대안들의 총합이 새로운 수요/니즈를 충족시키지 못할 때 새로 만들어져야 한다.

그러나 그것이 무엇인가에 대한 답은... 글쎄.. 앞서 말했던 강력한 비저너리를 따를 수도 있고 대중의 지혜인 이볼루셔너리를 따를 수도 있다.

여러 가지 대안이 있지만 특출난 것이 없을 때는 앙상블을 고려해볼 수가 있다. 머신러닝에서도 여러 가지 알고리즘들을 혼합해서 결과를 제시해주는 방법을 앙상블이라 부른다. 아침에 미국에도 사투리가 있고, 단어들마다 분포도가 다르다는 기사를 읽었다. (참고. 미국 영어, 지역마다 어떻게 다른가?) 기사의 지도를 보면 단어별로 지역성이 다름을 알 수가 있다. 그런데 특정인이 어느 지역 출신인지 판단하기 위해서는 한두개의 단어로는 판별하기 어렵다. 지역색이 명확한 많은 단어들을 물어보고 그것들의 총합으로 한 사람의 출신지역을 판변할 수 있을 것이다. 기사에서 개별 단어로 구분하기에는 지역이 광범위하지만, 모든 지도를 중첩했을 때는 아주 세밀하게 지역을 구분할 수가 있다.

조금 다른 이야기를 한 것같지만, A와 B 사이의 직접적인 연결이 어려우면 주변의 다른 것들을 종합해보면 답/힌트를 얻을 수도 있다는 점을 말하고 싶었다. A와 B 사이의 우회도로의 개통여부는 경유지인 C들을 통과하는 총 교통량으로 판별할 수가 있을테고, 특정인의 출신지역은 많은 단어들의 성조스펙트럼을 종합해서 판단할 수가 있을 것이다. 최근 빅데이터를 예측하기 위해서 Random Forest라는 방법론이 많이 언급되는데, 이는 여러 개별적인 작은 Tree를 앙상블해서 결과를 도출하는 것이다.

(2013.06.07 작성 / 2013.06.17 공개)

페이스북 페이지: https://www.facebook.com/unexperienced

댓글을 달아 주세요