'논문'에 해당되는 글 3건

  1. 2015.01.07 논문의 미래
  2. 2014.08.11 텍스트북과 페이퍼
  3. 2013.08.12 사이언스 엑설런스

논문의 미래

Gos&Op 2015.01.07 12:29 |
Share           Pin It
암울하다.

요즘 새로운 걸 좀 해보겠다고 Deep Learning 관련 논문들을 탐독하고 있습니다. 작년 초에 딥러닝이란 걸 들은 후에 논문 몇 편을 프린트해서 읽기 시작했는데 잘 읽혀지지 않아서 그냥 포기했습니다. 후반기에 추천 시스템(CBF)에 딥러닝을 사용한 사례가 있어서 관련 논문을 또 프린트해서 읽기는 했는데 뭔 소리를 하는지 전혀 감을 잡지 못했습니다. 그런데 작년 12월부터는 이해하든 못하든 그냥 딥러닝 논문들을 다양하게 많이 읽다 보면 용어나 개념에 익숙해지고 차츰 깨달음을 얻겠지 싶어서 (마치 기계를 학습시키듯) 읽어나가고 있습니다. 다행히 지금은 잘 모르는 이들에게 (전문가들에게 구라를 치면 바로 들킬테니) 대략적으로 설명은 해줄 수 있는 수준에 이르렀습니다. 그래서 조금 더 압축되고 어려운 논문을 찾아서 또 읽어나가기 시작했습니다. 그래서 또 좌절을 맛보고 있습니다.

이런 1년동안의 경험을 바탕으로 생각해보면 (학술) 논문의 미래는 없다라는 결론에 이릅니다.

비록 논문이 인류의 역사에서 중요한 역할을 해왔습니다. 새롭게 발견된 것을 논문이란 이름으로 정리해서 많은 이들에게 공표, 공유했습니다. 그런 논문을 읽은 이들은 또 그것에서 영감을 얻어서 새로운 사실을 추가해서 새로운 이론을 만들어서 다시 공유했습니다. 그런 식으로 다양한 사람들의 다양한 시각과 발견이 합쳐져서 다양한 분야에서 현재의 발전에 이르렀습니다. 발견과 공유라는 논문의 대승적 원칙에는 동감하지만, 이제 논문이 제 역할을 하기에는 너무 멀리 와 버렸다는 생각이 듭니다.

단순히 인터넷이 발전하면서 블로그 포스팅이 기존의 학술 논문을 대체하고, SNS가 저널 역할을 해주기 때문이 아닙니다. 웹이 새로운 저작과 공유의 도구를 만들어냈지만, 학술 논문과 저널이 가지는 전문성이나 깊이를 따라기기에는 격차가 여전히 큽니다. 연구가 주 목적인 학계와 개발이 목적인 산업계의 속도 차이에서 오는 괴리감도 학술 논문의 위기를 암시하지만, 여전히 학계의 기초 연구와 산업계의 응용 개발은 공존해야 합니다. 이런 현상은 논문이 다른 모습으로 진화하는 것을 부추기겠지만, 논문의 종말을 이끌지는 않을 것입니다.

그런데 어렵게 적히 몇 편의 논문을 읽으면서 이제 논문의 한계 수명을 다했구나라는 느낌을 받습니다. 새로운 발견에 대한 한 편의 논문을 제대로 이해할 수 있는 사람이 이 세상에 몇 명이나 될까?라는 생각이 듭니다. 그 분야에서 오랫동안 연구해왔던 전문가들은 아마도 그 논문이 가지는 함의와 영향을 바로 이해할 수 있을 것입니다. 그렇지만 그 분야의 밖에 있는 이들은 그 발견에서 중요한 인사이트를 얻기가 힘들 듯합니다. 논문을 읽고 이해할 수 있어야지 영감을 받을 수 있기 때문입니다.

논문이 더 압축되고 어려워질수록 (새로운 개념 자체가 어려운 경우도 있고, 그저 어렵게 적혀진 경우도 있음) 전문가들은 만족하겠지만 초보자들의 좌절합니다. 그런 논문들이 늘어날수록 논문은 전문가 집단, 즉 이너서클에서만 환영을 받고 그네들만을 위한 공유의 도구가 됩니다. 이너서클에서 인정받는 것도 중요하지만, 앞서 말했듯이 논문은 발견과 공유 즉 많은 이들에게 새로운 세상으로 안내하는 길라잡이가 되어야 합니다. 그런데 이제 (어렵게 적힌) 논문은 초보자들이 극복해야할 장애물이 됐습니다. 

한 편의 논문을 온전히 이해하기 위해서 선행해서 알아야하는 개념들이 너무 많아졌습니다. 줄줄이 엮인 논문들을 어느 정도 이해하고 나서야 처음 손에 잡았던 논문을 이해할 수 있습니다. 레퍼런스의 레퍼런스, 레퍼런스의 레퍼런스의 레퍼런스, ...를 모두 읽어야하는 경우도 존재합니다. (그리고 특정 분야의 전문가라고 해서 그 모든 것을 온전히 이해하고, 정리해서 타인들에게 알려줄 수도 없는 경우도 많습니다.) 그런데 전문가라는 사람들은 일부러 더 압축하고 어렵게 적으려는 경향도 어느 정도 있습니다. 소위 전문가 티를 내기 위해서입니다. 그냥 우스게 소리로 대가는 증명이 필요한 어려운 문제를 그냥 'it's trivial'이라고 말하고 증명을 생략한다라고 말합니다. (논문의 길이 제한 등으로 어쩔 수 없는 경우도 존재하지만) 개념적으로 쉽게 설명해도 되는 것들을 그냥 어려운 용어들을 나열하고 때로는 (직접적으로 관련이 없어도) 그럴듯한 개념들을 마구 수셔넣어서 압축합니다. (불필요한 수식도 가능한 자제했으면 하는 바람도 있지만, 오히려 그게 더 간결하고 이해하기에 쉬운 경우도 있으니 그것까지 불평하진 않겠습니다.)

공유를 위한 도구가 이제 견제를 위한 울타리가 됐다는 느낌을 받으며 (저의 무능을 감추기 위해서) 하소연 해봅니다.

학자 여러분들, 논문 좀 쉽게 쓰세요. 그게 당신의 가치를 깎아내리지 않습니다.

==
페이스북 페이지: https://www.facebook.com/unexperienced


댓글을 달아 주세요

텍스트북과 페이퍼

Gos&Op 2014.08.11 23:57 |
Share           Pin It
지난 금요일부터 또 필 받아서 업무 관련 논문을 하나둘 찾아서 읽고 있습니다. 그리고 내일은 그동안 진행했던 학습 네트워크에서 책 한권을 끝냈으니 앞으론 데이터 컨설팅을 시작할 거라는 얘기 또 자신의 데이터 문제를 정의하고 그걸 해결하기 위한 관련 논문을 더 찾아서 읽어보라고 조언할 예정입니다. 박사 학위를 받을 때 전후로 들었던 조언이 갑자기 생각났습니다. 그래서 글을 적습니다.

지금은 서울대로 가셨지만 대학원에 들어가서 그리고 박사후과정을 거칠 때 친하게 지낸 교수님이 계십니다. 당시에 한참 최신 연구 동향을 파악하고 논문에 인용/참조하기 위해서 관련된 논뭄들을 막 찾아서 프린트하고 읽어가던 때였습니다. 그때 교수님이 논문을 많이 읽는 것도 좋지만 텍스트북도 계속 읽어라는 조언을 했습니다. 논문은 최신 기술을 잘 소개하지만 전체 연구 트렌드를 반영하거나 그런 최신 연구가 발생한 히스토리 등을 제대로 정리해주지 못하기 때문에, 틈틈이 책을 읽어서 기초를 다지라는 조언입니다.

그런데 사실 책(원서)은 읽기가 귀찮을 때가 많습니다. 일단 두꺼워서 처음부터 끝까지 읽기가 만만치 않습니다. 그리고 이미 알고 있는 많은 내용을 담고 있어서 중복해서 읽는 것같아서 순간 지루해집니다. 그런데 이미 알고 있는 내용이라고해서 대강 읽거나 스킵해버리면 또 책 전체 내용을 파악하기 힘듭니다. 그러니 처음부터 꾸역꾸역 끝까지 읽어가야 합니다. 그렇게 처음 하루이틀은 열심히 읽는데 바쁜 일이 생기고 하면 서너 챕터까지는 읽다가 그만 보는 경우가 많습니다.

책을 읽는 것은 논문만으로 파악하기 힘든 관심/관련 분야의 전체를 조망해볼 수 있습니다. 적어도 나보다 몇 년, 몇 십년이나 더 많이 관련 분야에서 연구했던 분들이 전체를 조망하고 길을 제시했을 것입니다. 간혹 특정 알고리즘이나 방법론을 처음 제시했던 분들이 직접 적은 책도 있습니다. 책을 읽는다는 것은 모든 지식을 받아들인다는 것이 아니라, 그걸 통해서 전체의 흐름을 파악하고 전체 그림을 훑어본다는 의미가 있습니다. 그렇기에 자신의 문제에 맞는 연구 논문을 찾아서 빠르게 지식을 습득하는 것과 함께, 지루하더라도 책을 항상 옆에 두고 읽어나가고 참조해야 합니다.

학습 네트워크에서는 이제 책 한권을 어쨌든 끝냈기 때문에 더 상세한 지식을 얻기 위해서 논문을 찾아보라는 조언을 해주려는 것이지, 더 이상 책이 필요없다는 것을 말하려는 것이 아닙니다. 책이라는 것이 준비하는데 1~2년은 걸리고, 또 지금 출판된 집대성된 책도 5년에서 10년 전에 출판/개정된 경우가 많습니다. 연구에서 5년은 매우 긴 기간입니다. 대학을 졸업해서 박사 학위를 딸 수 있을만큼 긴 기간입니다. 특히 빠르게 발전하는 분야에서는 1~2년도 매우 긴 기간입니다. 책을 집필하고 준비하는 동안 새로 등장하는 문제나 방법론이 빠질 수 밖에 없습니다. 그렇기에 책을 모두 읽었다면 그것을 보강하기 위해서 최신 트렌드를 담은 논문을 찾아봐야 합니다.

그렇게 최신 논문을 읽으면서 또 최근에 나온 책을 찾아서 읽어야 합니다. 그런 반복을 거쳐야 합니다.  새로 나온 책이 예전에 읽은 것과 많이 다른 내용을 담고 있지 않을 가능성이 높습니다. 단지, 한두 챕터만 새로 추가된 경우도 많습니다. 그러나 책이라는 것이 저자의 시각을 통해서 정리되고 재구성되면서 부분부분으로 알던 지식이 하나로 통합되는 결과를 줍니다. 순간을 놓쳐도 트렌드를 잃어버리지만 긴 시간을 놓쳐도 트렌드를 읽지 못합니다.

오래 전에 트위터에 이런 글을 적은 적이 있습니다. … 과거 기억을 되살려서 트윗을 재구성하는 것보다는 그때 적은 트윗을 직접 인용하는 것이 나을 것같아서 찾아서 붙입니다.

==
페이스북 페이지: https://www.facebook.com/unexperienced


댓글을 달아 주세요

Share           Pin It

지난 주에 MIT Technology Review에 'The World's Best Scientific Institutions Ranked by Discipline' 제목으로 연구결과/웹사이트가 하나 소개되었습니다. Mapping Scienfitif Excellence라는 사이트인데, 최근(2005~2009)에 출간된 이공계 저널의 인용지수를 이용해서 각 학교/연구소마다 분야별로 얼마나 좋은 논문을 제출하느냐, 즉 각 연구소의 연구능력을 시각화해서 보여줍니다. 연구방법에 대한 자세한 설명은 http://excellencemapping.net/info.html를 읽어보시면 됩니다. 그리고, 연구내용을 보기 위해서는 패스워드가 필요한데, 그냥 password-request@excellencemapping.net로 메일을 보내면 바로 패스워드를 알려줍니다. 메일을 받으면 자동으로 리플라이되는 것이므로, 어떻게 내용을 채울까를 고민할 필요도 없습니다. 그냥 메일 보내면 됩니다.

사이트를 이용하는 방법은 쉽습니다. 오른쪽 날개에서 분야를 선택하시면 아래에 연구소들이 나열되는데 나열된 순서는 앞서 말한 사이테이션 인덱스를 multi-lever logistic regression으로 모델링해서 (분야별로) 우수논문을 작성할 확률 순으로 나열해서 보여줍니다. 상단의 검색창에 특정 키워드를 입력하면 필터링도 됩니다. 그리고 왼쪽 세계지도에는 각 연구소의 위치와 논문수와 논문/연구의 질을 보여줍니다. 원의 크기는 제출된 논문의 양을 뜻하고, 색깔은 논문의 질 (로지스틱회귀분석의 확률값, 빨강에서 파랑으로 갈수록 우수논문을 제출할 확률이 증가함)을 보여줍니다. 아래의 캡쳐화면은 Engeering 분야를 선택했고, 국내의 대학/연구소를 보기 위해서 KOR로 필터링했습니다.

사이트 및 데이터 자체가 단순해서 더 자세히 내용을 해석하고 설명할 여지도 없지만 그냥 보면서 느꼈던 점을 몇 가지 적겠습니다.

아직은 이공계 연구가 미국과 (서)유럽을 중심으로 이뤄지고 있다는 것이 데이터를 통해서 확연히 보여집니다. 최근에 아시아에서도 많은 연구가 이뤄지고 있고 많은 대학들이 생겼지만, 여전히 대부분의 분야에서 연구기관들은 미국와 유럽에 산재해있습니다. 그리고 연구의 질 측면에서도 미국와 유럽의 경우 파란색을 보여주지만 아시아나 아프리카는 붉은색이 대부분입니다.

그런데 수학이나 물리 등의 기초과학이나 의학 등을 제외한 Engineering 분야에서 아시아 지역에 많은 기관이 있음을 확인할 수 있습니다. 그러나 앞서 말했듯이 연구소/대학의 숫자는 많이 증가했지만 여전히 미국이나 유럽에 비해서 연구의 질은 낮은 것으로 되어있습니다. 인용도를 점수화했기 때문에, 아시아에서 많은 논문을 제출하지만 여전히 인용이 거의 되지 않는다는 의미입니다. 어쩌면 별로 좋지 못한 저널에 논문을 많이 제출했기 때문일 수도 있고, 아니면 미국와 유럽 지역에서 학문 분야에서도 카르텔을 형성해서 자기들끼리 서로 인용해주는 것은 아닌가?라는 의심도 품게 됩니다.

나머지는 직접 확인해보세요.

페이스북 페이지: https://www.facebook.com/unexperienced

댓글을 달아 주세요