본문 바로가기

Messages from Bahn

(1181)
다시 읽는 물리학 RE:Physics 인공지능을 제대로 이해하려거든 물리학을 다시 공부하라.이전 글에서 우리가 살고 있는 물리 세계와 마찬가지로 컴퓨터 프로그램/소프트웨어도 실제는 확률에 기반한 것이 아닐까?라는 의문을 제기했다. 한 보 더 나아가서 인공지능을 제대로 이해하고 연구하기 위해서는 물리학을 제대로 또는 다시 공부해야 한다는 주장을 펼치려 한다. 고등학교 물리 교과서에 나오는 영희가 500m 상공에서 1kg의 쇠구슬을 떨어뜨려 지면에 닿을 때 순간 속도와 운동 에너지를 구하라는 식의 문제를 풀기 위해 모든 법칙이나 수식을 다시 외우라는 얘기는 당연히 아니다. 지난 주일동안 줄곧 최소한 이공계 학문의 가장 기초는 물리학이고 그러니 물리학의 다양한 개념을 제대로 이해한다면 다른 분야, 특히 이 시리즈의 주제인 데이터 분석이나 인공지능..
양자역학과 인공지능 (Det vs Sto) 당연히 양자역학에 관한 글이 아니다. 어릴 적에 물리학을 전공하길 희망했지만 고3이 되면서 급하게 산업공학과로 진로를 정했던 사람으로서 여느 보통 사람들보다는 물리에 관한 지식이 조금 더 있을 수 있으나 내가 알고 있는 물리는 엄밀히 말해서 19세기까지의 물리 또는 고등학교 교과에서 배우는 물리, 즉 고전 물리다. 19세기말부터 기미가 보였지만 기적의 해인 1905년 이후 폭발적으로 새로 정립된 양자역학은 그저 교양 수준으로만 알고 있다. 특히 20세기 초반에 양자역학이 태동하여 정립되던 시절의 이야기는 반복해서 들어도 늘 재미있다. 재미있다는 게 양자역학을 제대로 이해하고 있다는 의미가 아니다. 수식으로 양자역학을 이해하려 하지 않았기 때문에 재미있는 건지도 모르겠다. 제목으로 ‘양자역학과 인공지능’이..
AI 시대유감 (돈의 게임) 어떤 문제를 해결할 AI 모델을 만드는 것을 개념적으로 그리면 아래의 Functional Model과 같다. GPU로 대표되는 적당한 하드웨어를 갖고 있으면 문제에 맞는 모델 아키텍처와 알고리즘으로 관련 데이터로 모델을 학습하면 해당 문제에 특화된 AI 모델이 만들어진다. 문제 복잡도에 따라서 아키텍처 종류나 규격 또는 필요한 데이터 양이 다를 수 있으나 잘 훈련된 혼자 또는 소수의 데이터 과학자만 있으면 꽤 괜찮은 모델을 학습해서 운영할 수 있’었’다. 지난 1년을 되돌아보면 LLM과 Diffusion 모델로 대표되는 생성형 AI가 대중에게 소개되면서 AI 모델을 구축하는 양상이 바뀌었다. 고전이 여전히 필요하지만 거대함이 요즘의 핵심이 됐다. 개발의 양상이 바뀐 거다. 2023년에 만들어진 LLM의 ..
가능성의 함정 인공지능 (AI)의 가장 큰 문제점은 무엇일까? 이전까지는 모르겠으나, ChatGPT 이후로는 Hallucination (또는 Confabulation)이라고 가장 많이 답변할 거라고 추측한다. 특히 검색과 연계하면서 거짓말하는 AI는 상상하기 어렵다. 검색이 아니더라도 내 편하고자 이용하는 AI인데 내가 원하는 답변과 전혀 다른 엉뚱한 결과만 내놓는다면 실망할 게 뻔하다. 하지만 AI를 어떤 용도로 사용하느냐에 따라서 Hallucination이 별로 문제가 되지 않기도 한다. 초소 LLM에 한정해서 개인적으로 내린 결론은 AI는 확인 (Confirmation)과 확장 (Expansion)에 사용하고, 그 외의 분야에 적용할 때는 주의를 기울여야 한다고 본다. 확인은 내가 이미 알고 있는 것에 관한 것이..
요즘 AI (LLM) ** 본문에 포함된 일부 용어는 학계/산업계의 일반 용례와 달리 편의를 위해 임의로 명명했으니 주의하기 바람. 4월부터 Arxiv 등에 올라오는 웬만한 언어모델 (LM, Language Model) 관련 논문은 following 하고 있다. 허깅페이스 (https://huggingface.co/papers)와 https://paperswithcode.com/에 새로 올라오는 논문들을 우선 확인하고, 때론 arxiv에 직접 접속해서 AI 관련 논문을 빠르게 확인한다. 우선 제목을 보고 논문의 주제를 대략 파악하지만, 제목만으로 이해하기 어려운 경우에는 초록 abstract을 읽거나 본문의 architecture나 overview 그림을 확인한다. 필요한 경우 실험 세팅과 결과도 확인하지만, 대부분 자신들의..
또 다른 AI 겨울은 올 것인가? ChatGPT가 세상에 선을 뵌 지 겨우 6 개월 밖에 지나지 않았다. 그 사이에 많은 변화가 있었고, 변화 속도는 점점 더 증가하고 있음을 느낀다. 지난 글 ‘지피티블루’를 적은 후로 우울한 마음을 함께 고민하자고 회사에서 최근 AI 동향을 짧게 발표했고, 한 달 간격으로 LLM (i.e., 텍스트 기반 Generative AI)를 중심으로 최신 동향 (LLM 관련 AI 논문, 주요 LLM과 오픈소스, 주요 테크 기업들의 AI 적용 등)을 두 번 더 공유했다. 최소 올해는 매달 비슷한 업데이터를 계속 진행할 예정이다. 3 달 전의 우울감은 새로 출현하는 기술들에 깊이 묻혀 잊히고 있다.최근의 생성형 AI (특히, Stable Diffusion 기반의 이미지/동영상 생성과 LLM 기반의 텍스트 생성)는 ..
지피티 블루 GPT Blue 지난주는 유난히 힘들었다. 평소보다 업무가 많아서 바빴던 것도 아니고 몸이 아프거나 컨디션이 저조했던 것도 아니다. 최근 다소 피곤한 상태가 이어지고 있지만 여느 때처럼 일찍 출근했고 매 끼니마다 식욕은 폭발했다. 일하긴 싫은데 (이건 항상 그랬다;;) 무기력하게 책상에 앉아서 그저 시간만 보낸 것 같다. 곰곰이 생각하니 전에도 몇 차례 비슷한 경험이 있었다. 대학원 진학이 결정된 후에 대학 동기들은 하나 둘 취업해서 포항을 떠날 때 스스로 뒤처지고 소외된 느낌을 받았다. 취업 후에는 매년 평가, 보상 시즌마다 비슷한 무력감을 느낀다. 평가 또는 보상을 잘 받고 못 받고를 떠나서 그냥 누군가에 의해서 평가받는다는 것에서 스스로 티끌이 된 듯한 자괴감을 매번 느낀다. 미래가 불확실하고 스스로 본인 능력에 ..
With AI, 새로운 게임의 시작. 역사는 지난 일주일을 MS 연합과 구글 동맹 간의 치열한 AI 전투로 기록할 것이다.MS 연합에 속한 OpenAI는 ChatGPT 성공에 고무된 후 연이어 텍스트와 이미지를 함께 처리하는 multimodal의 GPT-4를 기습적으로 발표했다. MS는 이미 Bing 검색에 GPT-4를 활용 중임을 밝히며 지원 사격을 했고 동시에 Office 제품군을 중심으로 AI 기반 사무 자동화 기능 (Co-pilot)을 선보였다. Code Red 중 Bard로 반격을 꽤 한 Google은 유리한 고지를 탈환하지 못 한 채 그동안 꽁꽁 숨겨뒀던 PaLM을 API로 공개함과 동시에 MS 코파일럿과 같은 기능을 자사 Workspace에 통합함으로 확전 의지를 나타냈다. 뿐만 아니라, Anthropic은 자체 LLM인 Cla..