거대언어모델(LLM)은 현재 인공지능 혁명의 중심에 서 있다. 인류의 미래를 좌우할 AGI(인공일반지능) 개발은 역사상 가장 위대한 발명 중 하나가 될 것이며, 어쩌면 마지막 발명이 될 수도 있다. 그러나 이러한 기술적 전환의 흐름 속에서 대한민국은 뚜렷한 존재감을 드러내지 못하고 있다. 글로벌 AI시장을 주도하는 회사는 스타트업이다. 특히 '소버린AI'는 선택이 아닌 필수다. 이는 국가의 미래 주권을 지키기 위한 핵심 전략이 되어야한다. 더 이상 머뭇거릴 시간이 없다.
[작성일: 2024년9월23일]
I. 빅테크 아닌, 스타트업 이 주도하는 글로벌 거대언어모델(LLM) 경쟁
에릭 슈미트 전 구글 CEO의 논란이된 스텐포드 인터뷰
에릭 슈미트 전 구글 CEO는 지난 스텐포드 유튜브 인터뷰에서 구글 내부의 문화에 대해 비판적인 견해를 밝혔다. 그는 구글이 경쟁에서 뒤처진 이유로 '일과 삶의 균형(work-life balance)'을 지나치게 중시한 점을 지적했다. 그의 주장에 따르면, 구글은 재택근무와 조기 퇴근 등 직원들의 삶의 질을 높이는 방향으로 조직 문화를 변화시켰고, 이로 인해 경쟁에서 이기기 위한 집중력과 열정이 저하되었다고 비판했다. 특히 그는 스타트업과 구글을 비교하며, 스타트업이 성공하는 이유는 직원들이 매우 열심히 일하기 때문이라고 강조했다. 반면, 구글은 더 이상 초창기와 같은 노력과 경쟁력을 발휘하지 못하고 있다고 지적했다. 그는 구글이 일과 삶의 균형을 우선시하는 것과 치열한 경쟁에서 승리하는 것 중에서 균형을 잡지 못한 것을 비판한 것이다. 이러한 발언은 언론과 소셜 미디어에서 화제가 되었고, 그의 사과와 영상 삭제로 이어졌다.
AI 혁명의 원동력, 창발성과 모험적 결단
지금의 거대언어모델(LLM)이 이룬 성과는창발성에 기반한다. 이는 단계적으로 축적된 기술이 아닌, 방대한 데이터 학습량이 특정 임계치(10의 22제곱 FLOPS)에 도달하면서 발생한질적 도약이다. 이를 일종의양질 전환이라고 볼 수 있다. 심층신경망에서 대규모 차원 변환이 일어나며, 벡터 공간 내 토큰들 간의 의미 관계가 압축된다. 이 과정에서 맥락이 형성되고 지능이 발현된다. 놀랍게도, 이 인공지능은 인간의 지능과 유사하거나 때로는 그를 뛰어넘는 성과를 보인다. 이러한 현상은비선형적 기술 도약으로, 연구자들조차 그 과정을 완벽히 설명하거나 추적하기 어려워졌다.
이러한 창발적 기술을 다루기 위해서는 연구자들의 집요한 열정이 필요하다. 끝이 보이지 않는 길에서도 멈추지 않는 노력이다. 챗GPT의 초기 공개 당시, 핵심 개발자 일리야 수츠케버가 어느 인터뷰에서 후발 개발자들에게 전한 말도 “믿음이 필요합니다”라는 간단한 조언이었다. 이 믿음은 마치 종교적 믿음과 과학적 신념의 경계 어딘가에 존재하는 것처럼 보인다. 기술 개발에는 자본과 인력도 중요하지만, 무엇보다 리더가 모든 것을 걸고 모험할 수 있는 용기와 결단이 필요하다.
애플 스티브 잡스의 혁신
수십 년간 IT 업계에서 일하면서 수많은 혁신을 보아왔지만, 초기 애플의 아이패드 핑거 제스처는 충격적이었다. 시대를 앞서는 미니멀리즘의 아름다움과 본질에 집중하려는 집요함이 담겨 있었다. 그것은 곧 시대의 아이콘이자 혁신으로 칭송받았다. 그 당시 물리적 키보드를 없애고 터치스크린과 핑거 제스처를 도입한다는 것은 감동적인 경험이었다. 그 당시 개발자와 함께 오랜시간 일하던 나는, 스티브 잡스가 이러한 혁신을 위해 얼마나 많은 사람들과 격론과 설득의 과정을 거쳤을지 짐작할 수 있었다. 그의 전기 『스티브 잡스』에는 그러한 논쟁과 치열한 과정이 고스란히 담겨 있다. 잡스는 다수가 반대하는 무모함을 추구했고, 그 열정이 혁신을 만들어냈다. 논리적인 설득보다는 본질에 다가가려는 집념이 더 중요했다. 이러한 혁신은 스타트업이나 천재적인 리더의 주도 하에서 가능하다. 반면, 오늘날의 빅테크는 조직의 크기와 안정성 때문에 그들만의 독창적인 도전을 하기 어려운 구조다. 진정한 혁신은 기존의 틀을 깨는 무모함을 용인하는 기업 문화에서 가능한 일이다.
애플의 스티브 잡스와 오픈AI의 샘 알트만
애플 스티브 잡스의 고집스러운 신념과 같이 오픈 AI, 샘 알트만은 모든 자본을 끌어다 모델의 크기를 키우는 결정적이고 위험한 선택을 이끌었던 것이다. 그러한 도전이 구글에서는 불가능한 일이다. 샘 알트만이 구글의 CEO로 있었다면 지금의 오픈AI 와 같은 성과를 만들지 못했을 수 있다. 지난해 이사회에서 해고되었다가 5일 만에 돌아온 샘 알트만은, 애플의 스티브 잡스가 이사회에서 쫓겨 났다가 다시 돌아온 사건과 데자뷰을 떠올리게 했다. 내부 임직원들과 갈등이 있다는 것은 리더가 자신의 확신을 밀고 간다는 것이기도 하다. 때론 독선으로 비춰지기도 하지만 이 경우는 천재적인 경영자의 확신에 찬 소신이었다. 샘 알트만은 앞으로도 자신의 확신을 가지고 스타트업 다운 모습으로 밀고 갈 것이라고 예상된다. 이역시 빅테크에서 기대하기 어려운 모습이다.
스타트업 Claude-3.5 Sonnet과 Mistral의 눈 부신 성과
전설적인 개발자 제프 딘과 알파폴드를 개발한 천재 데미스 하사비스가 이끄는 수많은 연구진과 막대한 자본을 총동원하고 있음에도 불구하고 구글은 여전히 고전을 면치 못하고 있다. 오히려 후발 주자인 스타트업들의 모델 성능이 구글을 따라잡고 심지어 앞서나가는 양상이다. 2021년 오픈AI 출신 연구자들이 설립한 앤트로픽은 대표적인 후발 스타트업으로, 최근 Claude-3.5 Sonnet을 출시하며 눈에 띄는 성능 개선으로 큰 주목을 받고 있다. 특히 프로그램 코딩 영역에서는 이미 챗GPT를 능가했다. 유럽을 대표하는 AI 기업 Mistral 또한 우수한 성능 평가를 받고 있다. AI 모델의 성능을 비교하는 사이트 Artificial Analysis의 상위 10위 랭킹에서 앤트로픽의 Claude-3.5 Sonnet과 Mistral Large2가 오픈AI에 이어 5위권을 차지하고 있다. 상위권을 스타트업들이 독차지하고 있는 것은 결코 우연이 아닐 것이다. 반면, 구글과 메타는 중하위권에 머물러 있다. 더욱 놀라운 점은 글로벌 시가총액 1, 2위를 다투는 초대형 빅테크 기업인 마이크로소프트와 애플이 이 순위에 들지 못했다는 사실이다.

스타트업이 주도하는 글로벌 SOTA 경쟁
구글은 가장 많은 인력과 자원을 투입하면서도 성능에 있어서 스타트업에 뒤처지고 있다는 평가를 받고 있다. 마이크로소프트는 자체 모델 개발 소식을 전하면서도, OpenAI에 대한 의존도를 줄이고자 오픈소스 계열과 Anthropic에 투자하는 등 분주한 모습이다. 애플은 뒤늦게 AI 추격을 선언하고 "인텔리전스"라는 AI 기능을 일부 공개했지만, 시장의 반응은 미온적이다. 아마도 OpenAI에 의존해야 하는 불편을 해소하려는 노력 속에서 깊은 고민에 빠진듯 보인다. 일론 머스크는 우주의 본질을 이해하겠다는 목표로 언어 모델 Grok의 성능 개선을 하고 있지만, 여전히 주류에 진입하지 못하고 있다.
글로벌 거대언어모델 SOTA 시장 경쟁 주도는 OpenAI, Anthropic, Mistral이며 모두 스타트이다. 그 밖에 오픈소스 진영의 "개미군단"이다. 흥미롭게도 빅테크 기업들이 이 경쟁을 주도하지 못하고 있음이 분명해 보인다. 물론 스타트업이 반드시 거대언어모델 개발에 유리하다고 단언할 순 없지만, 후발 주자인 우리로서는 주목할 만한 부분이다. 스타트업은 책임의 규모가 상대적으로 작고, 의사결정이 신속하며, 때로는 직관에 의존한 결정도 가능한 조직이다. 생성형 AI의 창발성은 혁신을 넘어서는 도약적 사고의 전개라는 점에서, 스타트업의 특성이 분명한 이점으로 작용할 수 있다.
II. 대한민국 국가 대표, 네이버 하이퍼클로바X
국내 상황에 비춰본 우리 현실
지금의 LLM 시장과 유사한 상황을 30년 전 국내 소프트웨어 산업에서도 찾아볼 수 있다. 삼성전자, LG전자, 현대전자와 같은 대기업들은 인터넷과 소프트웨어 트렌드를 파악하고 사업화를 시도했지만 실패하고 철수했다. 당시 소프트웨어 개발사에서 근무했던 경험을 돌이켜보면, 인터넷 기반 소프트웨어 산업의 혁신과 성과는 대부분 중소 벤처기업이 주도했다. 대표적인 예로, 삼성전자가 야심 차게 개발·출시한 한글 워드프로세서 '훈민정음'은 한컴의 '아래아한글'에 밀려 시장에서 사라졌다. 당시 대기업의 수직적 의사결정 구조는 어떠한 모험도 허용하지 않는 분위기였다.
이러한 벤처기업의 흐름은 스타트업으로 이어졌고, 그중 성공한 기업들은 유니콘으로 성장한다. 그러나 안타깝게도 현재의 기업 환경은 IT 스타트업에게 매우 가혹하다. 생존 자체가 어려울 뿐만 아니라, 성과를 내더라도 빅테크 기업의 견제와 인수합병을 피하기 힘들다. 투자 환경 역시 더욱 냉혹해졌다. 이로 인해 스타트업 생태계는 빈약한 상태에 놓여 있다. 특히 인재 유출 문제가 미디어에서 지속적으로 다뤄지고 있다. 생태계에 활력을 불어넣으려 해도 인재 없이는 시작조차 어렵다. 생성 AI가 새로운 변화의 기회를 제공했지만, 과거 벤처기업의 열기만큼 뜨겁게 달아오르지 못하고 있다. 이러한 상황에서 국내 빅테크 기업의 역할이 더욱 중요해졌다.
네이버의 잘못된 단추 꿰기(?)
거대언어모델(LLM) 시장 경쟁에서 국내 최대 빅테크 기업인 네이버의 존재감이 두드러진다. 그러나 네이버의 하이퍼클로바는 아직 기대에 미치지 못하는 평가와 실적을 보이고 있다. 이러한 어려움은 앞서 언급한 구글이 OpenAI를 따라잡지 못하는 이유와 유사할 수 있다. 네이버 역시 이미 빅테크이기 때문이다. 따라서 네이버에게는 근본적인 목표 수정과 접근법이 필요해 보인다. 그 시작점은 바로 ‘스타트업 정신’이 되어야 한다.
네이버는 2021년 5월 자체 거대언어모델 1세대를 공개한바 있다. 2023년 초까지만 해도 네이버가 글로벌 거대언어모델 경쟁에 도전해볼 만하다는 전망이 우세했다. 이는 과거 구글의 공세에도 불구하고 한국 검색시장을 지켜낸 세계 유일의 사례를 가진 네이버의 저력 때문이었다. 2023년 8월에는 챗GPT보다 한글 학습데이터가 6,500배 많아 한글에 경쟁력을 갖추고 국내시장을 지키겠다는 메시지와 함께 본격적인 2세대 모델 하이퍼클로바X을 선보였다. 그러나 이러한 접근에 대해 회의적인 시각을 갖을 수 밖에 없었다. 단순히 한글 데이터가 GPT보다 많다는 것만으로 한국 시장을 지킬 수 있다고 볼 수 없기 때문이다.

출처: 네이버 하정우연구소장 발표자료
이유는 두가지다. 첫번째는 거대언어모델의 특성상 핵심 경쟁력은 ‘추론능력’이다. 프롬프트의 내용을 통해 사용자의 ‘의도’(Intention)를 정확하게 추론하고 답변을 생성하는 능력이다. 추론 능력은 모델의 크기-학습데이터의 양과 품질-학습량과 밀접한 관계를 가진다. 하이퍼클로바X의 1세대 버전의 파라미터는 GPT-3에 비해 더 많은 2,040억개라고 밝혔다. 그런데 학습데이터는 1.92TB로 GPT-3의 45TB에 비해 크게 부족하다. 데이터의 품질은 추론 능력을 위해 가장 중요한 부분인데, GPT는 위키피디어자료와 미국회 도서관의 모든 책과 인터넷의 뉴스와 자료들이고 하이퍼클로바X는 네이버 블로그 글과 지식인 데이터와 뉴스자료등으로 알려져 있다. 하이퍼클로X의 학습량(FLOPS)에 있어서는 정확하게 공개된바 없지만 GPT-3는 초당 125조번 실수 연산 능력을 가진 엔비디아의 GPU V100 만 대를 클라우드 Azer에서 밤낯 없이 약 3개월 동안 학습을 수행했다. 그 추정 비용이 900억에서 1천억 정도 소요 되었다고 한다. 학습데이터의 양에서 상대적으로 적기 때문에 파라미터의 크기만으로 학습량을 늘이는건 과적합의 우려가 있다. 결국 학습량이 GPT에 훨씬 미치지 못했을 것으로 보인다.

출처: 모델별 학습량의 변화, TOP10개 AI epoch-ml-trends
두 번째, 거대언어모델은 언어를 구분하여 추론한다기 보다는 의미 단위(토큰)관계를 다룬다고 볼수 있다. 어휘소 즉, 최소 의미 단위인 토큰은 그 것이 어떤 언어가 되었든 간에 의미 관계로 벡터DB 공간에 무리지어 위치하게 된다. 따라서 이미 뛰어난 추론능력을 가진 언어모델은 다른 언어 데이터의 추가 학습으로 성능을 발휘할 가능성이 크다. 그래서 초기 GPT가 한글 프롬프트의 의도를 추론하는데 어려움이 있었지만 불과 4개월 만에 출시한 GPT-4 는 더 이상 한국어 사용에 불편이 없었다. 역으로 추론 능력이 부족한 거대언어모델은 언어와 무관하게 양질의 답변을 생성하지 못한다는 것도 예상 할 수 있다. 추론 능력은 인간의 IQ와 유사하다. 처음 부터 언어 문제는 큰 이슈가 될 수 없었다.
네이버의 새로운 전략 제안
그렇게 2023년8월24일 하이퍼클로바X는 공개 되었고, 전날 주가가 4% 급등했다가 다음날 8% 급락했다. 네이버 하이퍼클로바X는 우려 했던 것처럼 당시 GPT3.5와 Bard에 비해 현저히 부족한 성능을 보여주고 있었다. 무엇보다도 추론능력과 맥락 유지에 있어서 많이 부족했다. 그럼에도 불구하고 네이버는 가장 유력한 국가대표 AI 업체임에 틀림없다. 네이버는 두가지 전략적 수정이 필요하다.
첫째는 글로벌 거대언어모델 경쟁에 과감히 뛰어들어야 한다. 이는 단순히 국내 시장을 지키는 것을 넘어, 세계 무대에서 경쟁력을 갖추는 것을 의미한다. 네이버는 자사의 기술력과 데이터를 바탕으로 글로벌 수준의 10위권의 거대언어모델을 개발하고, 이를 통해 국제적인 영향력을 확대해야 한다. 이는 도전적인 과제이지만, 장기적으로 네이버와 국가의 AI 산업 발전에 필수적인 전략이다. 그것이 네이버의 역할이고 유일한 생존 전략이라고 생각하기 때문이다. 네이버가 역할을 다할때 국가와 국민적 지지의 정당성이 부여될 수 있다.
둘째, 네이버는 스타트업의 민첩성과 혁신성을 도입할 필요가 있다. 이는 모든 자원을 집중하여 단일 목표를 향해 과감하게 도전하는 전략을 의미한다. 현재의 복잡하고 다층적인 의사결정 구조로는 급변하는 생성 AI 시장에 효과적으로 대응하기 어렵다. 따라서 네이버는 AI 관련 자금과 인력을 별도의 독립적인 조직으로 분리하여, 빠른 의사결정과 과감한 투자가 가능한 구조를 만들어야 한다. 이는 결과에 대한 기회와 리스크를 모두 감수하며 독립적인 의사결정을 할 수 있는 조직을 의미한다. 이는 기존 조직에서 완전히 분리된 새로운 자회사나, 네이버 내부의 독립적인 사업부 형태가 될 수 있다. 이러한 조직은 리더의 신념과 비전을 중심으로 결집하여, 글로벌 AI 시장에서 경쟁력을 갖출 수 있는 거대언어모델을 개발하는 데 전념할 수 있을 것이다.
기존의 네이버는 검색 시장에서 'AI 검색 시장'으로 서비스 'Cue'를 반드시 정착시켜야 한다. 2025년부터 AI 검색 시장에서는 구글과 Perplexity, 오픈AI의 서치GPT, 마이크로소프트의 빙 AI가 승자독식을 놓고 치열한 경쟁을 벌이게 될 것이다. 우리가 검색 시장에서 경험했듯이, 사용자들은 가장 뛰어난 검색 도구에 안착하면 다른 것을 사용할 필요성을 느끼지 못한다. AI 검색도 마찬가지일 가능성이 크다. 사용자들은 가장 성능이 뛰어나고 만족스러운 AI 검색 툴 하나만을 사용할 것이기 때문이다. 이는 최후의 승자가 시장을 독식하는 흐름으로 이어질 수 있다. 필요하다면 오픈소스 진영과의 협업도 고려해볼 만하다. 시간을 벌어야 하기 때문이다. 네이버에게 남은 시간이 많지 않다. 이미 도래한 생성 AI 시대에서 거대 기업 네이버에게 거대언어모델 경쟁을 우회하는 신기방통한 생존 전략은 없어 보인다.
쉽지 않은 선택일 수 있지만, 생존을 위한 유일한 선택이라고 생각한다. 현재의 AI 시장 경쟁은 인류의 보편적인 삶의 방식을 전환시키는 거대한 흐름이다. 이는 인간의 사고를 모방하는 기능으로, 확장된 외부 두뇌(엑소브레인)를 얻는 것과 같다. 마치 제한된 신체 능력을 확장시켜 주는 '보행보조장치'와 유사하다. 즉, 인간의 지능을 무한히 확장시키는 전자 두뇌를 몸 밖에 지니게 되는 것이다. 이러한 흐름 속에서 국가와 언어는 더 이상 경계가 될 수 없다.
III. 국가 소버린 AI의 필요성과 지향점
국가 소버린 AI의 개념과 중요성 대두 배경 한편 국내 AI 기술을 논할 때 '소버린 AI'의 개념도 주목할 필요가 있다. 이는 국가 주도로 자체 AI 기술을 확보하자는 패러다임이다. 최근 AI를 둘러싼 글로벌 각축전이 배경으로 작용한다. 특히 미중 간 AI 패권 경쟁이 심화되면서, 자국 중심의 AI 생태계 구축이 시급해졌다. 실제로 미국은 첨단 반도체와 AI 기술의 중국 수출을 전면 금지하고 나섰다. 데이터 주권 확보와 AI 안보 역량 강화에도 박차를 가하고 있다. 중국 역시 자국 AI 기업을 적극 지원하며 미국에 맞서고 있다. 더욱이 AI 기술은 경제, 안보, 사회, 문화 등 모든 영역의 미래를 좌우할 게임 체인저다. 외세에 종속되지 않는 자주적 AI 역량 확보가 무엇보다 중요하다. 그래야 급변하는 세계 질서 속에서 한국의 전략적 자율성을 지켜낼 수 있다. 이런 맥락에서 주권 개념을 AI에 접목한 소버린 AI 담론이 중요해진 것이다.
문화적인 관점에서의 소버린 AI
소버린 AI는 단순한 기술 주권을 넘어 문화적 정체성을 지키는 근본적 가치와 연결된다. 거대언어모델의 학습 데이터는 해당 국가의 역사, 언어, 문화를 반영하므로, 특정 국가의 데이터로 학습된 AI 모델은 자연스럽게 그 국가의 세계관과 문화적 지향을 내재화한다. 예를 들어, 미국 중심의 빅테크가 개발한 AI를 한국인이 무비판적으로 수용하면 자국의 정신과 가치관을 잃을 위험이 있다. 특히 어린 학생들이 이러한 AI로부터 지식과 사고방식을 주입받는다면 문화적 종속이 우려된다. 이는 단순한 기술의 문제가 아닌 정체성의 문제다.
반면, 우리의 데이터로 만든 소버린 AI는 한국적 문화코드를 구현하는 일이다. 이는 삶의 방식과 사유 체계를 포함한 무형의 한국적 가치를 보존하는 작업이다. 이런 AI를 토대로 미래 지성을 기르고 문화적 다양성을 지켜내는 것이 중요하다. 이러한 문화적 명분 하에 소버린 AI는 국가 주도성을 띨 수밖에 없으며, 정부가 국책 프로젝트 형식으로 직접 개입해야 한다. 이는 민간 차원을 넘어선 범국가적 노력이 요구되는 중요한 과제다.
국가 단위의 정책과 지원 이를 위해 정부는 대규모 투자와 제도 정비에 나서야 한다. 가칭 범 국가적 '한국형 AI 프로젝트'를 발족해 종합적으로 지원할 필요가 있다. 기술, 인프라, 데이터 등 AI 개발의 토대를 전방위로 구축해야 한다. 구체적으로는 H100과 같은 고성능 GPU 등 대형 AI 학습 인프라를 갖추는 게 시급하다. 국가 주도로 양질의 한글 데이터를 구축하는 작업도 병행되어야 한다. 관련 법제도 정비와 규제 혁신도 뒤따라야 할 것이다. 자금 조달 측면에서는 AI 국부펀드를 조성하는 방안도 검토할 만하다. 필요하다면 특별법을 제정해서라도 재원을 마련해야 한다. 엄청난 돈이 들어가겠지만, 국가 미래를 위한 투자임을 잊어선 안 된다.
AI 식민지냐, AI 강국이냐, 대한민국의 운명을 결정할 순간 한편 소버린 AI 확보를 위한 기회의 창은 사실 그리 넓지 않다. AI 기술의 급속한 발전으로 선도국과의 격차가 빠르게 벌어질 우려가 크다. 특히 미중이 AI 규제에 나설 경우, 기술 장벽은 더욱 높아질 전망이다. 이들이 선제적으로 규제를 무기화해 자국 AI 산업을 보호할 가능성이 있기 때문이다. EU의 AI ACT나 미국의 AI 규제안이 이미 이런 신호를 보내고 있다. 후발국은 AI 활용에 더 큰 제약을 받게 될 것이다. 극단적으로는 소수 강대국이 AI 기술을 과점하는 "AI 카르텔"이 형성될 수도 있다—마치 핵 기술을 둘러싼 비확산 체제와 유사하게 말이다. AI 기술 격차가 심화될수록 자력으로 AI 강국에 도전하기는 점점 더 어려워질 것이다.
따라서 지금이야말로 총력전에 나설 적기다. 범정부 차원의 AI 전략을 가동해 이 기회의 창을 놓쳐선 안 된다. "벼랑 끝 전술"로 AI 주권 확보에 사활을 걸어야 한다. 이는 단순한 산업 육성을 넘어 국가 주권이 걸린 문제다. AI 경쟁에서 뒤처지면 디지털 식민지로 전락할 수 있기 때문이다. 거대언어모델의 토대 없이는 AI 응용 산업 전반이 모래 위의 성과 다름없다. 소버린 AI 실현에 진정성 있게 도전하지 않는다면, 대한민국의 국가경쟁력은 모래성처럼 무너질 수밖에 없을 것이다.
IV. 우리에게 소버린 AI는 불가능한가
거대언어모델 구축은 불가능할까?
단정 짓기엔 이르다. 네이버의 하이퍼클로바X, LG의 엑사원, KT 믿음, 카카오브레인 등 자체 모델이 이미 개발되어 있다. 글로벌 경쟁력 확보를 위해 한 단계 도약이 필요하지만, 기반은 마련되었다. 해외 사례를 보면 앤트로픽과 미스트랄이 늦은 출발에도 불구하고 구글을 제치고 상위 5위권에 진입했다. 최근 오픈AI를 떠난 핵심 개발자 일리야 슈츠케버는 '안전한 초지능(Safe Superintelligence)' 개발 계획을 발표했다.
정치권의 의지만 있다면 AI 국부펀드 조성도 가능할 것이다. 이제는 재원 마련의 구체적인 실행 방안을 고민할 때다. 핵심은 거대언어모델 개발 역량 확보다. 이를 위해선 최소 1조 단위의 투자가 요구된다. 과연 정부와 민간이 이 정도 역량과 의지가 있는지가 관건이다.
2류 1등 국가에서 1류 1등 국가로 가는 소보린 AI
30년 전 초고속정보통신망을 선제적으로 구축한 덕분에 우리나라는 지식정보화시대의 4차 산업을 주도하며 일본을 앞지르고 선진국 대열에 합류했다. 이제 AI라는 새로운 패러다임이 또 한 번의 획기적인 변화를 요구하고 있다. AI는 미래 100년을 위한 도약의 마지막 기회이자 유일한 출구일지 모른다. 미래의 성장 동력이 필요한 우리에게 AI만큼 유망한 분야는 찾기 힘들다. 따라서 우리는 AI 주권 확보에 국운을 걸어야 한다. 불확실성을 감수하고라도 국가적 역량을 총동원해야 할 때다.
100년 늦은 산업화로 2류 국가였던 우리가 이제 선진국 반열에 올랐다. TV와 같은 새로운 카테고리를 창조하지는 못했지만, 세계에서 TV를 가장 잘 만드는 나라가 되었다. 이제 AI가 1류 국가로 도약하기 위한 발판이 될 것이다.
AI 리터러시의 중요성
근래의 딥페이크 문제는 시작일 뿐이다. 지금의 뛰어난 성능의 AI에 대한 이해와 비판적 사고능력을 통해 인간과의 차이점을 뚜렷하게 인식할 필요가 있다. 그것이 AI리터러시 이다. 대학에서 부터 일반인을 대상으로 교육을 강화하여 AI와 인간 상호작용에서 발생할 수 있는 사회적, 문화적, 법적, 윤리적 문제에 대응해야 한다. 이를 위해서는 다학제적인 논의와 협력을 통한 융합적접근이 필수적이다. 인공지능리터러시연구소(www.ailiteracy.or.kr)는 그러한 역할을 준비하고 있다.
결국, 소버린 AI는 국가적 의지와 역량의 문제로 귀결된다. 기술, 자본, 인력 등 가용한 자원을 총동원해 거대언어모델에 도전할 때다. 우리는 AI가 미래 국가경쟁력의 핵심 변수라는 점을 직시해야 한다. AI 주권 확립이 곧 국가주권 수호의 관건이 될 것이기 때문이다. 소버린 AI의 추진 과정은 험난할 것이다. 정부와 기업, 학계 등 각계각층의 협력이 필수적이며, 장기적 비전 아래 사회적 공감대를 형성하고 국민적 역량을 결집하는 리더십도 절실하다. 이제 한국형 AI 모델 개발로 새로운 기적에 도전할 때다. 이는 대한민국의 미래를 위한 신성장동력이 될 것이다. 긴 안목에서 과감한 투자를 아끼지 말아야 할 이유가 바로 여기에 있다.
거대언어모델(LLM)은 현재 인공지능 혁명의 중심에 서 있다. 인류의 미래를 좌우할 AGI(인공일반지능) 개발은 역사상 가장 위대한 발명 중 하나가 될 것이며, 어쩌면 마지막 발명이 될 수도 있다. 그러나 이러한 기술적 전환의 흐름 속에서 대한민국은 뚜렷한 존재감을 드러내지 못하고 있다. 글로벌 AI시장을 주도하는 회사는 스타트업이다. 특히 '소버린AI'는 선택이 아닌 필수다. 이는 국가의 미래 주권을 지키기 위한 핵심 전략이 되어야한다. 더 이상 머뭇거릴 시간이 없다.
[작성일: 2024년9월23일]
I. 빅테크 아닌, 스타트업 이 주도하는 글로벌 거대언어모델(LLM) 경쟁
에릭 슈미트 전 구글 CEO의 논란이된 스텐포드 인터뷰
에릭 슈미트 전 구글 CEO는 지난 스텐포드 유튜브 인터뷰에서 구글 내부의 문화에 대해 비판적인 견해를 밝혔다. 그는 구글이 경쟁에서 뒤처진 이유로 '일과 삶의 균형(work-life balance)'을 지나치게 중시한 점을 지적했다. 그의 주장에 따르면, 구글은 재택근무와 조기 퇴근 등 직원들의 삶의 질을 높이는 방향으로 조직 문화를 변화시켰고, 이로 인해 경쟁에서 이기기 위한 집중력과 열정이 저하되었다고 비판했다. 특히 그는 스타트업과 구글을 비교하며, 스타트업이 성공하는 이유는 직원들이 매우 열심히 일하기 때문이라고 강조했다. 반면, 구글은 더 이상 초창기와 같은 노력과 경쟁력을 발휘하지 못하고 있다고 지적했다. 그는 구글이 일과 삶의 균형을 우선시하는 것과 치열한 경쟁에서 승리하는 것 중에서 균형을 잡지 못한 것을 비판한 것이다. 이러한 발언은 언론과 소셜 미디어에서 화제가 되었고, 그의 사과와 영상 삭제로 이어졌다.
AI 혁명의 원동력, 창발성과 모험적 결단
지금의 거대언어모델(LLM)이 이룬 성과는창발성에 기반한다. 이는 단계적으로 축적된 기술이 아닌, 방대한 데이터 학습량이 특정 임계치(10의 22제곱 FLOPS)에 도달하면서 발생한질적 도약이다. 이를 일종의양질 전환이라고 볼 수 있다. 심층신경망에서 대규모 차원 변환이 일어나며, 벡터 공간 내 토큰들 간의 의미 관계가 압축된다. 이 과정에서 맥락이 형성되고 지능이 발현된다. 놀랍게도, 이 인공지능은 인간의 지능과 유사하거나 때로는 그를 뛰어넘는 성과를 보인다. 이러한 현상은비선형적 기술 도약으로, 연구자들조차 그 과정을 완벽히 설명하거나 추적하기 어려워졌다.
이러한 창발적 기술을 다루기 위해서는 연구자들의 집요한 열정이 필요하다. 끝이 보이지 않는 길에서도 멈추지 않는 노력이다. 챗GPT의 초기 공개 당시, 핵심 개발자 일리야 수츠케버가 어느 인터뷰에서 후발 개발자들에게 전한 말도 “믿음이 필요합니다”라는 간단한 조언이었다. 이 믿음은 마치 종교적 믿음과 과학적 신념의 경계 어딘가에 존재하는 것처럼 보인다. 기술 개발에는 자본과 인력도 중요하지만, 무엇보다 리더가 모든 것을 걸고 모험할 수 있는 용기와 결단이 필요하다.
애플 스티브 잡스의 혁신
수십 년간 IT 업계에서 일하면서 수많은 혁신을 보아왔지만, 초기 애플의 아이패드 핑거 제스처는 충격적이었다. 시대를 앞서는 미니멀리즘의 아름다움과 본질에 집중하려는 집요함이 담겨 있었다. 그것은 곧 시대의 아이콘이자 혁신으로 칭송받았다. 그 당시 물리적 키보드를 없애고 터치스크린과 핑거 제스처를 도입한다는 것은 감동적인 경험이었다. 그 당시 개발자와 함께 오랜시간 일하던 나는, 스티브 잡스가 이러한 혁신을 위해 얼마나 많은 사람들과 격론과 설득의 과정을 거쳤을지 짐작할 수 있었다. 그의 전기 『스티브 잡스』에는 그러한 논쟁과 치열한 과정이 고스란히 담겨 있다. 잡스는 다수가 반대하는 무모함을 추구했고, 그 열정이 혁신을 만들어냈다. 논리적인 설득보다는 본질에 다가가려는 집념이 더 중요했다. 이러한 혁신은 스타트업이나 천재적인 리더의 주도 하에서 가능하다. 반면, 오늘날의 빅테크는 조직의 크기와 안정성 때문에 그들만의 독창적인 도전을 하기 어려운 구조다. 진정한 혁신은 기존의 틀을 깨는 무모함을 용인하는 기업 문화에서 가능한 일이다.
애플의 스티브 잡스와 오픈AI의 샘 알트만
애플 스티브 잡스의 고집스러운 신념과 같이 오픈 AI, 샘 알트만은 모든 자본을 끌어다 모델의 크기를 키우는 결정적이고 위험한 선택을 이끌었던 것이다. 그러한 도전이 구글에서는 불가능한 일이다. 샘 알트만이 구글의 CEO로 있었다면 지금의 오픈AI 와 같은 성과를 만들지 못했을 수 있다. 지난해 이사회에서 해고되었다가 5일 만에 돌아온 샘 알트만은, 애플의 스티브 잡스가 이사회에서 쫓겨 났다가 다시 돌아온 사건과 데자뷰을 떠올리게 했다. 내부 임직원들과 갈등이 있다는 것은 리더가 자신의 확신을 밀고 간다는 것이기도 하다. 때론 독선으로 비춰지기도 하지만 이 경우는 천재적인 경영자의 확신에 찬 소신이었다. 샘 알트만은 앞으로도 자신의 확신을 가지고 스타트업 다운 모습으로 밀고 갈 것이라고 예상된다. 이역시 빅테크에서 기대하기 어려운 모습이다.
스타트업 Claude-3.5 Sonnet과 Mistral의 눈 부신 성과
전설적인 개발자 제프 딘과 알파폴드를 개발한 천재 데미스 하사비스가 이끄는 수많은 연구진과 막대한 자본을 총동원하고 있음에도 불구하고 구글은 여전히 고전을 면치 못하고 있다. 오히려 후발 주자인 스타트업들의 모델 성능이 구글을 따라잡고 심지어 앞서나가는 양상이다. 2021년 오픈AI 출신 연구자들이 설립한 앤트로픽은 대표적인 후발 스타트업으로, 최근 Claude-3.5 Sonnet을 출시하며 눈에 띄는 성능 개선으로 큰 주목을 받고 있다. 특히 프로그램 코딩 영역에서는 이미 챗GPT를 능가했다. 유럽을 대표하는 AI 기업 Mistral 또한 우수한 성능 평가를 받고 있다. AI 모델의 성능을 비교하는 사이트 Artificial Analysis의 상위 10위 랭킹에서 앤트로픽의 Claude-3.5 Sonnet과 Mistral Large2가 오픈AI에 이어 5위권을 차지하고 있다. 상위권을 스타트업들이 독차지하고 있는 것은 결코 우연이 아닐 것이다. 반면, 구글과 메타는 중하위권에 머물러 있다. 더욱 놀라운 점은 글로벌 시가총액 1, 2위를 다투는 초대형 빅테크 기업인 마이크로소프트와 애플이 이 순위에 들지 못했다는 사실이다.
스타트업이 주도하는 글로벌 SOTA 경쟁
구글은 가장 많은 인력과 자원을 투입하면서도 성능에 있어서 스타트업에 뒤처지고 있다는 평가를 받고 있다. 마이크로소프트는 자체 모델 개발 소식을 전하면서도, OpenAI에 대한 의존도를 줄이고자 오픈소스 계열과 Anthropic에 투자하는 등 분주한 모습이다. 애플은 뒤늦게 AI 추격을 선언하고 "인텔리전스"라는 AI 기능을 일부 공개했지만, 시장의 반응은 미온적이다. 아마도 OpenAI에 의존해야 하는 불편을 해소하려는 노력 속에서 깊은 고민에 빠진듯 보인다. 일론 머스크는 우주의 본질을 이해하겠다는 목표로 언어 모델 Grok의 성능 개선을 하고 있지만, 여전히 주류에 진입하지 못하고 있다.
글로벌 거대언어모델 SOTA 시장 경쟁 주도는 OpenAI, Anthropic, Mistral이며 모두 스타트이다. 그 밖에 오픈소스 진영의 "개미군단"이다. 흥미롭게도 빅테크 기업들이 이 경쟁을 주도하지 못하고 있음이 분명해 보인다. 물론 스타트업이 반드시 거대언어모델 개발에 유리하다고 단언할 순 없지만, 후발 주자인 우리로서는 주목할 만한 부분이다. 스타트업은 책임의 규모가 상대적으로 작고, 의사결정이 신속하며, 때로는 직관에 의존한 결정도 가능한 조직이다. 생성형 AI의 창발성은 혁신을 넘어서는 도약적 사고의 전개라는 점에서, 스타트업의 특성이 분명한 이점으로 작용할 수 있다.
II. 대한민국 국가 대표, 네이버 하이퍼클로바X
국내 상황에 비춰본 우리 현실
지금의 LLM 시장과 유사한 상황을 30년 전 국내 소프트웨어 산업에서도 찾아볼 수 있다. 삼성전자, LG전자, 현대전자와 같은 대기업들은 인터넷과 소프트웨어 트렌드를 파악하고 사업화를 시도했지만 실패하고 철수했다. 당시 소프트웨어 개발사에서 근무했던 경험을 돌이켜보면, 인터넷 기반 소프트웨어 산업의 혁신과 성과는 대부분 중소 벤처기업이 주도했다. 대표적인 예로, 삼성전자가 야심 차게 개발·출시한 한글 워드프로세서 '훈민정음'은 한컴의 '아래아한글'에 밀려 시장에서 사라졌다. 당시 대기업의 수직적 의사결정 구조는 어떠한 모험도 허용하지 않는 분위기였다.
이러한 벤처기업의 흐름은 스타트업으로 이어졌고, 그중 성공한 기업들은 유니콘으로 성장한다. 그러나 안타깝게도 현재의 기업 환경은 IT 스타트업에게 매우 가혹하다. 생존 자체가 어려울 뿐만 아니라, 성과를 내더라도 빅테크 기업의 견제와 인수합병을 피하기 힘들다. 투자 환경 역시 더욱 냉혹해졌다. 이로 인해 스타트업 생태계는 빈약한 상태에 놓여 있다. 특히 인재 유출 문제가 미디어에서 지속적으로 다뤄지고 있다. 생태계에 활력을 불어넣으려 해도 인재 없이는 시작조차 어렵다. 생성 AI가 새로운 변화의 기회를 제공했지만, 과거 벤처기업의 열기만큼 뜨겁게 달아오르지 못하고 있다. 이러한 상황에서 국내 빅테크 기업의 역할이 더욱 중요해졌다.
네이버의 잘못된 단추 꿰기(?)
거대언어모델(LLM) 시장 경쟁에서 국내 최대 빅테크 기업인 네이버의 존재감이 두드러진다. 그러나 네이버의 하이퍼클로바는 아직 기대에 미치지 못하는 평가와 실적을 보이고 있다. 이러한 어려움은 앞서 언급한 구글이 OpenAI를 따라잡지 못하는 이유와 유사할 수 있다. 네이버 역시 이미 빅테크이기 때문이다. 따라서 네이버에게는 근본적인 목표 수정과 접근법이 필요해 보인다. 그 시작점은 바로 ‘스타트업 정신’이 되어야 한다.
네이버는 2021년 5월 자체 거대언어모델 1세대를 공개한바 있다. 2023년 초까지만 해도 네이버가 글로벌 거대언어모델 경쟁에 도전해볼 만하다는 전망이 우세했다. 이는 과거 구글의 공세에도 불구하고 한국 검색시장을 지켜낸 세계 유일의 사례를 가진 네이버의 저력 때문이었다. 2023년 8월에는 챗GPT보다 한글 학습데이터가 6,500배 많아 한글에 경쟁력을 갖추고 국내시장을 지키겠다는 메시지와 함께 본격적인 2세대 모델 하이퍼클로바X을 선보였다. 그러나 이러한 접근에 대해 회의적인 시각을 갖을 수 밖에 없었다. 단순히 한글 데이터가 GPT보다 많다는 것만으로 한국 시장을 지킬 수 있다고 볼 수 없기 때문이다.
출처: 네이버 하정우연구소장 발표자료
이유는 두가지다. 첫번째는 거대언어모델의 특성상 핵심 경쟁력은 ‘추론능력’이다. 프롬프트의 내용을 통해 사용자의 ‘의도’(Intention)를 정확하게 추론하고 답변을 생성하는 능력이다. 추론 능력은 모델의 크기-학습데이터의 양과 품질-학습량과 밀접한 관계를 가진다. 하이퍼클로바X의 1세대 버전의 파라미터는 GPT-3에 비해 더 많은 2,040억개라고 밝혔다. 그런데 학습데이터는 1.92TB로 GPT-3의 45TB에 비해 크게 부족하다. 데이터의 품질은 추론 능력을 위해 가장 중요한 부분인데, GPT는 위키피디어자료와 미국회 도서관의 모든 책과 인터넷의 뉴스와 자료들이고 하이퍼클로바X는 네이버 블로그 글과 지식인 데이터와 뉴스자료등으로 알려져 있다. 하이퍼클로X의 학습량(FLOPS)에 있어서는 정확하게 공개된바 없지만 GPT-3는 초당 125조번 실수 연산 능력을 가진 엔비디아의 GPU V100 만 대를 클라우드 Azer에서 밤낯 없이 약 3개월 동안 학습을 수행했다. 그 추정 비용이 900억에서 1천억 정도 소요 되었다고 한다. 학습데이터의 양에서 상대적으로 적기 때문에 파라미터의 크기만으로 학습량을 늘이는건 과적합의 우려가 있다. 결국 학습량이 GPT에 훨씬 미치지 못했을 것으로 보인다.
출처: 모델별 학습량의 변화, TOP10개 AI epoch-ml-trends
두 번째, 거대언어모델은 언어를 구분하여 추론한다기 보다는 의미 단위(토큰)관계를 다룬다고 볼수 있다. 어휘소 즉, 최소 의미 단위인 토큰은 그 것이 어떤 언어가 되었든 간에 의미 관계로 벡터DB 공간에 무리지어 위치하게 된다. 따라서 이미 뛰어난 추론능력을 가진 언어모델은 다른 언어 데이터의 추가 학습으로 성능을 발휘할 가능성이 크다. 그래서 초기 GPT가 한글 프롬프트의 의도를 추론하는데 어려움이 있었지만 불과 4개월 만에 출시한 GPT-4 는 더 이상 한국어 사용에 불편이 없었다. 역으로 추론 능력이 부족한 거대언어모델은 언어와 무관하게 양질의 답변을 생성하지 못한다는 것도 예상 할 수 있다. 추론 능력은 인간의 IQ와 유사하다. 처음 부터 언어 문제는 큰 이슈가 될 수 없었다.
네이버의 새로운 전략 제안
그렇게 2023년8월24일 하이퍼클로바X는 공개 되었고, 전날 주가가 4% 급등했다가 다음날 8% 급락했다. 네이버 하이퍼클로바X는 우려 했던 것처럼 당시 GPT3.5와 Bard에 비해 현저히 부족한 성능을 보여주고 있었다. 무엇보다도 추론능력과 맥락 유지에 있어서 많이 부족했다. 그럼에도 불구하고 네이버는 가장 유력한 국가대표 AI 업체임에 틀림없다. 네이버는 두가지 전략적 수정이 필요하다.
첫째는 글로벌 거대언어모델 경쟁에 과감히 뛰어들어야 한다. 이는 단순히 국내 시장을 지키는 것을 넘어, 세계 무대에서 경쟁력을 갖추는 것을 의미한다. 네이버는 자사의 기술력과 데이터를 바탕으로 글로벌 수준의 10위권의 거대언어모델을 개발하고, 이를 통해 국제적인 영향력을 확대해야 한다. 이는 도전적인 과제이지만, 장기적으로 네이버와 국가의 AI 산업 발전에 필수적인 전략이다. 그것이 네이버의 역할이고 유일한 생존 전략이라고 생각하기 때문이다. 네이버가 역할을 다할때 국가와 국민적 지지의 정당성이 부여될 수 있다.
둘째, 네이버는 스타트업의 민첩성과 혁신성을 도입할 필요가 있다. 이는 모든 자원을 집중하여 단일 목표를 향해 과감하게 도전하는 전략을 의미한다. 현재의 복잡하고 다층적인 의사결정 구조로는 급변하는 생성 AI 시장에 효과적으로 대응하기 어렵다. 따라서 네이버는 AI 관련 자금과 인력을 별도의 독립적인 조직으로 분리하여, 빠른 의사결정과 과감한 투자가 가능한 구조를 만들어야 한다. 이는 결과에 대한 기회와 리스크를 모두 감수하며 독립적인 의사결정을 할 수 있는 조직을 의미한다. 이는 기존 조직에서 완전히 분리된 새로운 자회사나, 네이버 내부의 독립적인 사업부 형태가 될 수 있다. 이러한 조직은 리더의 신념과 비전을 중심으로 결집하여, 글로벌 AI 시장에서 경쟁력을 갖출 수 있는 거대언어모델을 개발하는 데 전념할 수 있을 것이다.
기존의 네이버는 검색 시장에서 'AI 검색 시장'으로 서비스 'Cue'를 반드시 정착시켜야 한다. 2025년부터 AI 검색 시장에서는 구글과 Perplexity, 오픈AI의 서치GPT, 마이크로소프트의 빙 AI가 승자독식을 놓고 치열한 경쟁을 벌이게 될 것이다. 우리가 검색 시장에서 경험했듯이, 사용자들은 가장 뛰어난 검색 도구에 안착하면 다른 것을 사용할 필요성을 느끼지 못한다. AI 검색도 마찬가지일 가능성이 크다. 사용자들은 가장 성능이 뛰어나고 만족스러운 AI 검색 툴 하나만을 사용할 것이기 때문이다. 이는 최후의 승자가 시장을 독식하는 흐름으로 이어질 수 있다. 필요하다면 오픈소스 진영과의 협업도 고려해볼 만하다. 시간을 벌어야 하기 때문이다. 네이버에게 남은 시간이 많지 않다. 이미 도래한 생성 AI 시대에서 거대 기업 네이버에게 거대언어모델 경쟁을 우회하는 신기방통한 생존 전략은 없어 보인다.
쉽지 않은 선택일 수 있지만, 생존을 위한 유일한 선택이라고 생각한다. 현재의 AI 시장 경쟁은 인류의 보편적인 삶의 방식을 전환시키는 거대한 흐름이다. 이는 인간의 사고를 모방하는 기능으로, 확장된 외부 두뇌(엑소브레인)를 얻는 것과 같다. 마치 제한된 신체 능력을 확장시켜 주는 '보행보조장치'와 유사하다. 즉, 인간의 지능을 무한히 확장시키는 전자 두뇌를 몸 밖에 지니게 되는 것이다. 이러한 흐름 속에서 국가와 언어는 더 이상 경계가 될 수 없다.
III. 국가 소버린 AI의 필요성과 지향점
국가 소버린 AI의 개념과 중요성 대두 배경 한편 국내 AI 기술을 논할 때 '소버린 AI'의 개념도 주목할 필요가 있다. 이는 국가 주도로 자체 AI 기술을 확보하자는 패러다임이다. 최근 AI를 둘러싼 글로벌 각축전이 배경으로 작용한다. 특히 미중 간 AI 패권 경쟁이 심화되면서, 자국 중심의 AI 생태계 구축이 시급해졌다. 실제로 미국은 첨단 반도체와 AI 기술의 중국 수출을 전면 금지하고 나섰다. 데이터 주권 확보와 AI 안보 역량 강화에도 박차를 가하고 있다. 중국 역시 자국 AI 기업을 적극 지원하며 미국에 맞서고 있다. 더욱이 AI 기술은 경제, 안보, 사회, 문화 등 모든 영역의 미래를 좌우할 게임 체인저다. 외세에 종속되지 않는 자주적 AI 역량 확보가 무엇보다 중요하다. 그래야 급변하는 세계 질서 속에서 한국의 전략적 자율성을 지켜낼 수 있다. 이런 맥락에서 주권 개념을 AI에 접목한 소버린 AI 담론이 중요해진 것이다.
문화적인 관점에서의 소버린 AI
소버린 AI는 단순한 기술 주권을 넘어 문화적 정체성을 지키는 근본적 가치와 연결된다. 거대언어모델의 학습 데이터는 해당 국가의 역사, 언어, 문화를 반영하므로, 특정 국가의 데이터로 학습된 AI 모델은 자연스럽게 그 국가의 세계관과 문화적 지향을 내재화한다. 예를 들어, 미국 중심의 빅테크가 개발한 AI를 한국인이 무비판적으로 수용하면 자국의 정신과 가치관을 잃을 위험이 있다. 특히 어린 학생들이 이러한 AI로부터 지식과 사고방식을 주입받는다면 문화적 종속이 우려된다. 이는 단순한 기술의 문제가 아닌 정체성의 문제다.
반면, 우리의 데이터로 만든 소버린 AI는 한국적 문화코드를 구현하는 일이다. 이는 삶의 방식과 사유 체계를 포함한 무형의 한국적 가치를 보존하는 작업이다. 이런 AI를 토대로 미래 지성을 기르고 문화적 다양성을 지켜내는 것이 중요하다. 이러한 문화적 명분 하에 소버린 AI는 국가 주도성을 띨 수밖에 없으며, 정부가 국책 프로젝트 형식으로 직접 개입해야 한다. 이는 민간 차원을 넘어선 범국가적 노력이 요구되는 중요한 과제다.
국가 단위의 정책과 지원 이를 위해 정부는 대규모 투자와 제도 정비에 나서야 한다. 가칭 범 국가적 '한국형 AI 프로젝트'를 발족해 종합적으로 지원할 필요가 있다. 기술, 인프라, 데이터 등 AI 개발의 토대를 전방위로 구축해야 한다. 구체적으로는 H100과 같은 고성능 GPU 등 대형 AI 학습 인프라를 갖추는 게 시급하다. 국가 주도로 양질의 한글 데이터를 구축하는 작업도 병행되어야 한다. 관련 법제도 정비와 규제 혁신도 뒤따라야 할 것이다. 자금 조달 측면에서는 AI 국부펀드를 조성하는 방안도 검토할 만하다. 필요하다면 특별법을 제정해서라도 재원을 마련해야 한다. 엄청난 돈이 들어가겠지만, 국가 미래를 위한 투자임을 잊어선 안 된다.
AI 식민지냐, AI 강국이냐, 대한민국의 운명을 결정할 순간 한편 소버린 AI 확보를 위한 기회의 창은 사실 그리 넓지 않다. AI 기술의 급속한 발전으로 선도국과의 격차가 빠르게 벌어질 우려가 크다. 특히 미중이 AI 규제에 나설 경우, 기술 장벽은 더욱 높아질 전망이다. 이들이 선제적으로 규제를 무기화해 자국 AI 산업을 보호할 가능성이 있기 때문이다. EU의 AI ACT나 미국의 AI 규제안이 이미 이런 신호를 보내고 있다. 후발국은 AI 활용에 더 큰 제약을 받게 될 것이다. 극단적으로는 소수 강대국이 AI 기술을 과점하는 "AI 카르텔"이 형성될 수도 있다—마치 핵 기술을 둘러싼 비확산 체제와 유사하게 말이다. AI 기술 격차가 심화될수록 자력으로 AI 강국에 도전하기는 점점 더 어려워질 것이다.
따라서 지금이야말로 총력전에 나설 적기다. 범정부 차원의 AI 전략을 가동해 이 기회의 창을 놓쳐선 안 된다. "벼랑 끝 전술"로 AI 주권 확보에 사활을 걸어야 한다. 이는 단순한 산업 육성을 넘어 국가 주권이 걸린 문제다. AI 경쟁에서 뒤처지면 디지털 식민지로 전락할 수 있기 때문이다. 거대언어모델의 토대 없이는 AI 응용 산업 전반이 모래 위의 성과 다름없다. 소버린 AI 실현에 진정성 있게 도전하지 않는다면, 대한민국의 국가경쟁력은 모래성처럼 무너질 수밖에 없을 것이다.
IV. 우리에게 소버린 AI는 불가능한가
거대언어모델 구축은 불가능할까?
단정 짓기엔 이르다. 네이버의 하이퍼클로바X, LG의 엑사원, KT 믿음, 카카오브레인 등 자체 모델이 이미 개발되어 있다. 글로벌 경쟁력 확보를 위해 한 단계 도약이 필요하지만, 기반은 마련되었다. 해외 사례를 보면 앤트로픽과 미스트랄이 늦은 출발에도 불구하고 구글을 제치고 상위 5위권에 진입했다. 최근 오픈AI를 떠난 핵심 개발자 일리야 슈츠케버는 '안전한 초지능(Safe Superintelligence)' 개발 계획을 발표했다.
정치권의 의지만 있다면 AI 국부펀드 조성도 가능할 것이다. 이제는 재원 마련의 구체적인 실행 방안을 고민할 때다. 핵심은 거대언어모델 개발 역량 확보다. 이를 위해선 최소 1조 단위의 투자가 요구된다. 과연 정부와 민간이 이 정도 역량과 의지가 있는지가 관건이다.
2류 1등 국가에서 1류 1등 국가로 가는 소보린 AI
30년 전 초고속정보통신망을 선제적으로 구축한 덕분에 우리나라는 지식정보화시대의 4차 산업을 주도하며 일본을 앞지르고 선진국 대열에 합류했다. 이제 AI라는 새로운 패러다임이 또 한 번의 획기적인 변화를 요구하고 있다. AI는 미래 100년을 위한 도약의 마지막 기회이자 유일한 출구일지 모른다. 미래의 성장 동력이 필요한 우리에게 AI만큼 유망한 분야는 찾기 힘들다. 따라서 우리는 AI 주권 확보에 국운을 걸어야 한다. 불확실성을 감수하고라도 국가적 역량을 총동원해야 할 때다.
100년 늦은 산업화로 2류 국가였던 우리가 이제 선진국 반열에 올랐다. TV와 같은 새로운 카테고리를 창조하지는 못했지만, 세계에서 TV를 가장 잘 만드는 나라가 되었다. 이제 AI가 1류 국가로 도약하기 위한 발판이 될 것이다.
AI 리터러시의 중요성
근래의 딥페이크 문제는 시작일 뿐이다. 지금의 뛰어난 성능의 AI에 대한 이해와 비판적 사고능력을 통해 인간과의 차이점을 뚜렷하게 인식할 필요가 있다. 그것이 AI리터러시 이다. 대학에서 부터 일반인을 대상으로 교육을 강화하여 AI와 인간 상호작용에서 발생할 수 있는 사회적, 문화적, 법적, 윤리적 문제에 대응해야 한다. 이를 위해서는 다학제적인 논의와 협력을 통한 융합적접근이 필수적이다. 인공지능리터러시연구소(www.ailiteracy.or.kr)는 그러한 역할을 준비하고 있다.
결국, 소버린 AI는 국가적 의지와 역량의 문제로 귀결된다. 기술, 자본, 인력 등 가용한 자원을 총동원해 거대언어모델에 도전할 때다. 우리는 AI가 미래 국가경쟁력의 핵심 변수라는 점을 직시해야 한다. AI 주권 확립이 곧 국가주권 수호의 관건이 될 것이기 때문이다. 소버린 AI의 추진 과정은 험난할 것이다. 정부와 기업, 학계 등 각계각층의 협력이 필수적이며, 장기적 비전 아래 사회적 공감대를 형성하고 국민적 역량을 결집하는 리더십도 절실하다. 이제 한국형 AI 모델 개발로 새로운 기적에 도전할 때다. 이는 대한민국의 미래를 위한 신성장동력이 될 것이다. 긴 안목에서 과감한 투자를 아끼지 말아야 할 이유가 바로 여기에 있다.