본문 바로가기

DM ML AD

(131)
또 다른 AI 겨울은 올 것인가? ChatGPT가 세상에 선을 뵌 지 겨우 6 개월 밖에 지나지 않았다. 그 사이에 많은 변화가 있었고, 변화 속도는 점점 더 증가하고 있음을 느낀다. 지난 글 ‘지피티블루’를 적은 후로 우울한 마음을 함께 고민하자고 회사에서 최근 AI 동향을 짧게 발표했고, 한 달 간격으로 LLM (i.e., 텍스트 기반 Generative AI)를 중심으로 최신 동향 (LLM 관련 AI 논문, 주요 LLM과 오픈소스, 주요 테크 기업들의 AI 적용 등)을 두 번 더 공유했다. 최소 올해는 매달 비슷한 업데이터를 계속 진행할 예정이다. 3 달 전의 우울감은 새로 출현하는 기술들에 깊이 묻혀 잊히고 있다.최근의 생성형 AI (특히, Stable Diffusion 기반의 이미지/동영상 생성과 LLM 기반의 텍스트 생성)는 ..
지피티 블루 GPT Blue 지난주는 유난히 힘들었다. 평소보다 업무가 많아서 바빴던 것도 아니고 몸이 아프거나 컨디션이 저조했던 것도 아니다. 최근 다소 피곤한 상태가 이어지고 있지만 여느 때처럼 일찍 출근했고 매 끼니마다 식욕은 폭발했다. 일하긴 싫은데 (이건 항상 그랬다;;) 무기력하게 책상에 앉아서 그저 시간만 보낸 것 같다. 곰곰이 생각하니 전에도 몇 차례 비슷한 경험이 있었다. 대학원 진학이 결정된 후에 대학 동기들은 하나 둘 취업해서 포항을 떠날 때 스스로 뒤처지고 소외된 느낌을 받았다. 취업 후에는 매년 평가, 보상 시즌마다 비슷한 무력감을 느낀다. 평가 또는 보상을 잘 받고 못 받고를 떠나서 그냥 누군가에 의해서 평가받는다는 것에서 스스로 티끌이 된 듯한 자괴감을 매번 느낀다. 미래가 불확실하고 스스로 본인 능력에 ..
With AI, 새로운 게임의 시작. 역사는 지난 일주일을 MS 연합과 구글 동맹 간의 치열한 AI 전투로 기록할 것이다.MS 연합에 속한 OpenAI는 ChatGPT 성공에 고무된 후 연이어 텍스트와 이미지를 함께 처리하는 multimodal의 GPT-4를 기습적으로 발표했다. MS는 이미 Bing 검색에 GPT-4를 활용 중임을 밝히며 지원 사격을 했고 동시에 Office 제품군을 중심으로 AI 기반 사무 자동화 기능 (Co-pilot)을 선보였다. Code Red 중 Bard로 반격을 꽤 한 Google은 유리한 고지를 탈환하지 못 한 채 그동안 꽁꽁 숨겨뒀던 PaLM을 API로 공개함과 동시에 MS 코파일럿과 같은 기능을 자사 Workspace에 통합함으로 확전 의지를 나타냈다. 뿐만 아니라, Anthropic은 자체 LLM인 Cla..
데이터 vs 모델 (알고리즘) Between data and model, which is more important in AI era? 이런 류의 질문은 누군가 내게 직접 물어봤으면 좋겠지만 아무도 묻지 않으니 자문자답한다. AI 관련 글이나 동영상에 AI 시대에 데이터와 모델 (또는 알고리즘)의 중요성에 관한 설명을 종종 보곤 한다. 직접적으로 내게 '뭐가 더 중요해?’라고 묻는다면 당연히 ‘듈다’라고 답하겠지만, 기술의 발전 단계 상에서 둘 간의 경중이 계속 변해왔음을 볼 수 있다. 굳이 현시점을 기준으로 답한다면 다시 데이터가 더 중요해졌다고 본다. 더 많은 데이터보다는 정제되고 신뢰할 수 있는 데이터가 중요해지고 있다. 이전 글에서 밝혔듯이 이젠 이런 류의 질문은 먼저 ChatGPT의 답을 보고 계속 설명을 이어가자. (Kor..
오래된 질문 My answer to an old question 10년 안에 인공지능으로 대체될 직업은? 잊을만하면 등장하는 떡밥 기사다. 내용은 매우 구체적이다. 외국의 유수 대학교 연구에 따르면 "20XX 년까지 Y%의 직업이 인공지능 또는 로봇으로 대체된다"라고 밝혀졌다 류의 기사다. 기술의 종류가 간혹 바뀔 뿐 뉘앙스는 매번 똑같다. 산업화 이후로 직업의 종류가 바뀌었고 그 변화의 중심에 기술이 있다는 걸 부정하진 않는다. 그런데 주변을 보면 벌써 몇 십 년 전에 없어졌어야 할 직업에 여전히 종사하는 사람들을 종종 본다. 대표적으로 인간문화재 급의 수공애 장인들이 있다. 자동화 공장이 있지만 여전히 소규모 대장간이 존재한다. 이케아 가구로 집을 가득 채울 수도 있지만 자개 장인도 있고 작은 목공소들도 있다. ..
내가 묻고 AI가 답하다. 인공지능, ChatGPT 시대에 살아남는 법에 대한 두 번째 글을 준비하고 있었다. 첫 번째는 질문하기였는데 두 번째는 그 대척점의 평가하기였다. 생각이 완벽히 정리되지 않은 시점에 글을 적으니 논리가 술술 풀리지 않아서 며칠을 묶혀뒀다. 그러나가 좀 전에 그냥 ChatGPT에게 ‘인공지능의 시대에 무슨 기술이나 지식이 필요한가?’라는 짧은 질문을 던졌다. 그냥 그 답을 옮긴다. Q. Which skills or knowledge are required in the ai era? (번역본은 아래에) ChatGPT’s Answer. As we continue to enter the era of artificial intelligence (AI), there are certain skills and know..
LLM은 왜/어떻게 작동하는가? 제목을 더 자극적으로 ‘ChatGPT는 왜 동작하는가?”로 할 수도 있지만 어차피 ChatGPT도 한 때고 새로운 LM이 나와서 이번이 진짜 AGI다라고 또 주장할 테니 중립적으로 LM은 어떻게 동작하고 왜 LLM이 작동하는가라고 정했다. 이 글은 기술적으로 LM이나 GPT/LaMDA 등을 다루지 않고, 단지 일반 독자의 이해를 돕기 위한 글이다. 개념적으로 설명한 것이니 기술적으로 완전히 틀렸을 수도 있다. Wikipedia는 Language Model (LM, 언어모델)을 ‘a probability distribution over sequences of words’라고 정의한다. 이를 좀 쉽게 설명하면 어떤 단어 (또는 문장)이 주어지면 바로 다음에 올 단어(의 확률)를 예측하는 거다. ‘I am a..
모든 ML 알고리즘의 이해 이직 후로는 면접에 들어가지 않고 있지만 면접에서 유능한 인재를 만나면 묻고 싶었지만 아직 한 번도 묻지 못한 질문이 있다. 머신러닝 학습의 핵심이 뭐냐? 는 질문이다. 개별 알고리즘의 개념이 아닌 모든 알고리즘들의 공통된 근간이 무엇인지를 묻는 질문이다. 내가 생각하는 이 질문의 답에 관한 글이다. 물론 내가 틀렸을 수도 있다. 모든 — 적어도 내가 아는 모든 — ML 알고리즘은 유사도 (또는 거리)를 측정하는 거다. 나 (X)랑 닮은 X’를 찾거나 나랑 전혀 다른 X’’를 찾는 것이 ML 알고리즘이다. 회귀 Regression은 나랑 닮은 X들이 공통으로 같은 Y, 보통은 평균을 예측/계산하는 알고리즘이다. 분류 Classificaiton은 나와 근접한 X들이 다수를 점유하는 클래스를 찾는 거다. C..