지피티 블루 GPT Blue
지난주는 유난히 힘들었다. 평소보다 업무가 많아서 바빴던 것도 아니고 몸이 아프거나 컨디션이 저조했던 것도 아니다. 최근 다소 피곤한 상태가 이어지고 있지만 여느 때처럼 일찍 출근했고 매 끼니마다 식욕은 폭발했다. 일하긴 싫은데 (이건 항상 그랬다;;) 무기력하게 책상에 앉아서 그저 시간만 보낸 것 같다. 곰곰이 생각하니 전에도 몇 차례 비슷한 경험이 있었다. 대학원 진학이 결정된 후에 대학 동기들은 하나 둘 취업해서 포항을 떠날 때 스스로 뒤처지고 소외된 느낌을 받았다. 취업 후에는 매년 평가, 보상 시즌마다 비슷한 무력감을 느낀다. 평가 또는 보상을 잘 받고 못 받고를 떠나서 그냥 누군가에 의해서 평가받는다는 것에서 스스로 티끌이 된 듯한 자괴감을 매번 느낀다. 미래가 불확실하고 스스로 본인 능력에 확신이 약해질 때마다 의기소침해진다. 지난 주가 그랬다. 아직 봄을 탈만큼 꽃이 핀 것도 아닌데… 제목을 보고 눈치챘겠지만 최근의 인공지능 (AI)의 대폭발에서 오는 무기력이라고 일단 스스로 진단했다. 과거 러다이트 운동가들처럼 지피티 포비아와는 다르다. 그저 변하는 속도에 따라갈 수 없다는 좌절감이다. 내가 뭘 해야 하지라는 고민을 할 짬도 없이 새로운 것들이 마구 쏟아진다. 생각할 시간은 사치다. 뉴스를 따라잡을 시간도 없다. 나야 적당히 몇 년을 때우다 은퇴하면 그만이지만 지금 어린 후배들은 어떻게 살아남을 수 있을지 걱정이다. 한편으론 AI/LLM을 활용한 다양한 아이디어가 떠올라서 좋지만, 다른 편으론 나름 알고리즘을 만드는 사람으로서 저런 — GPT-4와 같은 — 결과물을 뛰어넘는, 아니 그보다 조금 못한 거라도 만들어낼 수 있을까?라는 좌절이다. 내가 지금 하고 있는 연구/활동들이 모두 무의미해졌다. 일례로 작년에 Knowledge Graph 기반으로 만성 질환 관리에 관한 논문을 학회에 제출했는데, 학회 발표 직전에 나온 ChatGPT의 결과를 보고 — 신뢰도는 일단 무시하자 — 우리가 1년 동안 뭔 짓을 한 거지라는 자괴감이 들었다.
과연 인간은 인공지능의 시대에 살아남을 수 있을까? 우리의 업은 안전한 건가? 이전에는 긍정적으로 글을 적었지만 점점 더 부정적으로 바뀌고 있다. OpenAI와 MS에서 나온 두 논문이 많이 회자됐다. (하단 링크 참조) ‘GTPs are GTPs’ 논문은 거의 대부분의 직업이 최소 10% 정도는 인공지능으로 보완 또는 대체될 수 있다고 봤고, 20%는 최소 50% 이상이 대체된다고 결론을 내렸다. 연구방법이나 사용한 데이터가 옳은가는 논외로 두자. 개인적으로 ‘현재 컴퓨터로 하는 거의 모든 일’은 인공지능으로 대체될 수 있다고 판단한다. 즉 그걸 업으로 삼은 사람들은 모두 실업자가 된다는 정해진 미래로 가고 있다. 그리고 두 번째 ’Sparks of AGI’ 논문은 GPT-4의 등장으로 그동안 사람들이 말하던 AGI (일반인공지능) 시대가 도래했다고 결론 내렸다. 그동안 ‘Human-level performance’에 대해 오해하고 있었다. 불과 십여 년 전 딥러닝 (i.e., CNN, RNN)이 등장했을 때의 human-level은 말 그대로 일반 사람을 지칭했다. 사진을 보고 개와 고양이를 구분할 수 있는가? 문장을 읽고 화자의 의도를 파악할 수 있는가? 와 같은 류의 평가였다. 물론 개인마다 지식과 경험의 차이가 있어서 희귀한 개의 품종을 말한다거나 지루한 철할 논쟁의 핵심을 파악하지는 못할 수도 있다. 그런데 두 번째 논문에서 말하는 human-level은 소위 전문가, 즉 expert-level을 뜻한다. 나름 똑똑한 사람이 몇 년의 대학교육을 이수 후에 겨우 취득하는 변호사 시험이나 의사 면허 시험을 통과할 수 있느냐?로 human-level의 정의가 바뀌었다. 의사 면허와 변호사 자격증을 동시에 가진 사람도 더러 있지만, GPT-4는 이 둘 외에 더 다양한 — 개념적으로 모든 — 전문직 시험을 통과할 수 있다. (여담이지만, 한 5년마다 정기적으로 판사/검사/변호사/의사/세무사/회계사/… 등등의 전문직들의 자격 유지 시험을 치러서 인공지능보다 성적이 못하면 자격을 박탈하는 제도를 만들었으면 좋겠다.)
두 번째 논문의 아래 그림에서 특히 인상 깊었다. 우선 그림을 그리는 생성형 AI는 존재하지만 텍스트 토큰 기반 LLM이 그림을 그릴 수 없다고 은연중에 생각했는데 TikZ라는 Latex 패키지로 그림을 그릴 수 있다는 걸 미처 알지 못한 점에 부끄럼을 느꼈다. 더 놀라운 점은 아래 설명처럼 보름을 주기로 같은 질문 ‘draw a unicorn in TikZ / TikZ로 유니콘을 그려라’을 세 번 했는데 그 사이에 GPT-4가 계속 학습/진화하면서 그림 실력이 늘었다는 거다. 이미 넘사벽인데 계속 진화하고 있다는 거다.
나는 그저 몇 년을 더 버티다가 은퇴하면 그만인데 후배들은 어떻게 이런 파고를 헤쳐 넘어갈 수 있을까? 지금 안전장치가 없는 모든 사람들은 깊이 고민해서 자신의 길을 정해야 한다. 안전장치가 없다는 것은 저학력, 저소득의 사회 취약계층을 뜻하는 것이 아니다. 최소한 이런 글에 관심을 가지는 나름 배운 사람들 중에서 확실한 미래가 보장되지 않은 모든 이들을 뜻한다. 건물이 있어서 당장 은퇴해도 먹고살 수 있다거나 상위 영점 몇 퍼센트에 속하는 천재이거나, 아니면 최소한 가진 것 없어도 안빈낙도할 수 있는 자연인이 아니면 모두가 위험하다. 오히려 공장의 저숙련 노동자 (비하의 의도 아님)들이 인공지능의 시대에 더 생존가능성이 높아 보인다. 앞서 말했듯이 현재 컴퓨터로 하는 모든 작업에서 인간이 불필요해질 것 같다. 최대한 넓게 잡아서 상위 10%의 개발자는 여전히 개발하면서 밥벌어 먹고 살겠지만 나머지는 이 업계를 떠나거나 아키텍트가 그려놓은 설계도대로 인공지능이 코드를 버그 없이 제대로 구현했는지를 기계적으로 검수하는 디버거/QA 역할에 만족해야 할 거다. 이마저도 필요 없는 단계가 오겠지만… 새로운 — 공통되고 반복되는 모듈은 이미 인공지능의 손에 — 시스템을 설계할 수 있는 개발자는 살아남을 거고 그렇지 않으면 필요 없어질 거다. 귀에 딱지가 질만큼 반복해서 강조하지만 질문을 할 수 있는, 즉 새로운 개념을 설계할 수 있어야 한다.
회사의 임원이 먼저 필요 없어질까 아니면 평사원이 먼저 없어질까? 컴퓨터의 대중화로 예전에 비서나 부하직원이 대신하던 많은 일들을 임원이 직접 처리한다. 그럼에도 여전히 비서가 다른 잡다한 걸 대신 처리한다. 앞에선 후배들을 걱정했는데 이젠 기술에 문외한 선배들이 걱정된다. 기술 시대에 그들은 고스펙의 무능력자들이다. 더 완벽한 기술이 도입됐을 때의 임원과 비서의 관계는 어떻게 될까? 인공지능이 비서를 완벽히 대체해서 지금 사무직들은 모두 자리를 잃는 걸까? 아니면 어차피 최고 VIP가 지시한 걸 인공지능이 알아서 다 판단하고 처리할 테니 임원을 포함한 모든 중간 관리자는 사라지고 (검수 정도만 할) 말단만 남게 되는 걸까? 가능성은 다양할 거다. 최소한 임원 또는 비서의 역할은 완전히 바뀔 거다. 옳은 질문을 할 수 있는 사람만이 승진해야 한다. 한 5년 정도는 안전할 수도 있으나 그 후로는 기술에 문외하고 사고가 닫힌 위가 더 위험하다고 본다. 비전이 없거나 혁신의 창발을 막는 사람들이다. 어디서 본 건 있어가지고 뭔가 새로운 게 나오면 등장하는 우리 형, 아니 한국형이나 K-만 주야장천 외치는 사람보다는 그래도 가능성이 있는 어린 친구들에게 희망을 건다. (이 문단은 여러 생각이 혼합돼서 논리적이지 않음을 감안하길 바란다.) 실패를 감수하고 새로운 개념을 제시하는 기초 연구의 (투자 그리고 그걸 밀고 나가는 리더의 의지) 중요성이 크다.
인간은 창의력, 즉 상상력이 있기 때문에 여전히 인공지능보다 우위에 있다고 주장할 거다. 과연 창의력에서 인간이 인공지능보다 더 나을까? 그래픽 디지털 아트를 창작하는 상황을 가정하자. 꽤 괜찮은 수준의 인간이 평균적으로 1시간에 1점 정도를 그릴 수 있다고 하면, 하루에 8시간, 주 5일을 그리면 40점 (대한민국에서는 69점?)을 그릴 수 있다. 인공지능은 단 몇 초만에 1점씩 만들겠지만, 계산 편의를 위해서 1분마다 1점씩 만들 수 있다고 치자. 그러면 하루 24시간 (1,440분)에 주 7일 동안 10,080점을 만들 수 있다. 사람의 작품의 대부분 괜찮을 거고 인공지능의 것은 조잡한 게 많이 있을 거라고 반론을 제기할 수 있다. 사람은 90%, 인공지능은 1%만 채택된다는 조건을 추가하자. 이제 사람은 일주일에 36점, 인공지능은 약 101점을 그려서 사람보다 약 3배 생산력을 갖는다. 인공지능이 1만 점을 그리더라도 인간이 모두 검수해야 하기 때문에 저만큼의 생산성을 갖지 못한다고 또 반론을 제기할 수 있다. GAN의 Discriminator 같은 검수 프로그램이 조잡한 50% 정도는 걸러낼 수 있다고 치면 검수 대상은 5,000점으로 줄어든다. 텍스트를 검수하는 거라면 꽤 많은 시간이 필요하겠지만, 그래픽 아트라면 한 화면에 10장에서 수 십 장을 한꺼번에 띄어놓고 단 수 초 안에 괜찮은 작품 10% 정도는 걸러낼 수 있다. 이제 남은 5%, 즉 500점을 좀 더 길게 검수해서 100점 만을 추리는데 몇 시간이면 충분하다. 만약 최종 선정작의 분위기 등을 바꾸고 싶다면 사람은 추가로 1시간 동안 2~3개를 수정작을 만들겠지만, 인공지능은 몇십에서 몇 백 개를 바로 제시할 수 있다. 어쩌면 선정 과정에서 여러 변형작들을 함께 보여줄지도 모른다. 천재들의 기발함, 정말 새로운 개념을 만들어내는 능력은 당장 인공지능이 따라가지 못하겠지만 개념이 하나 등장하면 그걸 모방해서 변형하는 건 쉽다. 인공지능이 일하고 사람은 검수만 하는 보조가 되는 건가? 양이 질을 결정한다.
사람이 필요한 이유는 아직은 사람에게 필요한 일을 하기 때문이다. 그런데… (디스토피아)
너무 우울한 얘기만 했다. 이런 상황을 어떻게 극복할 수 있을지 나도 모르겠다. 그래도 마음의 평안을 얻기 위해서 인공지능이 해결하지 못하는 문제를 제시하고 그걸 제대로 해결하지 못하는 걸 보면서 잠시나마 위안을 얻기를 바란다. 트위터에서 본 ‘1 6 16 36 76’ 다음에 올 숫자가 뭔지를 유추하라고 했더니 ChatGPT가 (설명과 함께) 156을 정확히 답했다. 그래서 ‘6 2 8 2 10 18’ 다음에 올 숫자를 말하라고 했더니 제대로 해결하지 못했다. 다시 ‘3 1 4 1 5 9’ 다음에 올 숫자를 말하고 했더니 원주율 Pi와 연결해서 2라는 정답을 말했다. 다시 힌트가 pi임을 밝히며 다시 ‘6 2 8 2 10 18’ 문제를 제시했더니 여전히 ChatGPT는 헤맸다. 언젠가 이 문제도 해결하겠지만 그전까지는 이런 걸로 작은 위로로 삼자.
말은 쉽지만 막연한 두려움은 떨쳐내자. MS 코파일럿이든 구글의 AI-workspace든 아직은 개념을 보여주는 발표 동영상뿐이다. 실제 제품이 나왔을 때 직접 사용해 보면 막연한 두려움보다는 더 큰 삶의 애착이 생길 수도 있다. 물론 완전 knock-down이 될 수도 있다. 어쨌든 손으로 직접 만져보기 전까진 미리 낙담할 이유가 없다. 어떤 상황에서도 살아남을 수 있는 사람들은 있다. 그 사람이 나/너일까?
건강한 사회적 논의가 시급하다. 하지만 지금 정부가 하는 꼬락서니를 보면… 기술보다 이게 더 나를 우울하게 만든다.
달고나 시리즈 중 가장 우울한 글이다. 미안하게 생각한다. 나도 답답하다. 각자의 사정이 모두 다르겠지만 하루나 이틀 또는 그 이상의 충분한 시간을 내서 자신이 몸담고 있는 업의 미래를 깊이 고민해 보기 바란다. 가능하면 주변 사람들과 심도 깊은 논의를 해보는 것도 좋다. 학생이라면 지금 전공에서 상위 0.01%에 속할 수 있는지 점검해 보길 바란다. 오히려 더디어 일의 굴레에서 벗어나서 완전한 자유를 누릴 시간에 이르렀을 지도… (꿈깨)
Reference.
- GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large Language Models https://arxiv.org/pdf/2303.10130.pdf
- Sparks of Artificial General Intelligence: Early experiments with GPT-4 https://arxiv.org/pdf/2303.12712v1.pdf
조금 더 추가, 정제된 버전은 브런치에서. https://brunch.co.kr/@jejugrapher/281