2025.12.07
오픈소스 투명성으로 기술력 입증, 트릴리온랩스가 여는 한국 LLM의 다음 단계
- OpenUP -
AI 시대, 수많은 기업이 ‘AI’를 내걸고 등장하는 가운데 기술력으로 주목받는 스타트업이 있다. 트릴리온랩스(Trillion Labs)다. 2024년에 설립된 이 회사는 첫해에 580만 달러(약 90억 원) 규모의 투자를 유치했으며, 2025년에는 아마존웹서비스가 주관하는 AWS 생성형 AI 엑셀러레이터 프로그램에 50:1의 경쟁률을 뚫고 선정됐다. 이 프로그램은 전 세계 스타트업 중 약 40개 기업을 선정해 최대 100만 달러를 지원한다.
또한 11월 초에는 과학기술정보통신부가 추진하는 국가 전략 사업인 ‘AI 특화 파운데이션 모델 프로젝트’ 개발 기관으로 최종 선정됐다. 설립 2년 차인 트릴리온랩스가 여러 기관의 주목을 받는 이유는 바로 기술력이다. 국내에서도 드문 LLM 개발에 과감히 투자하고 있으며, 나아가 이 기술을 오픈소스로 공개하고 있다는 점에서도 의미가 크다.
트릴리온랩스라는 사명은 '트릴리온(1조) 파라미터 규모의 모델을 만들 수 있는 팀'을 지향한다는 의미에서 지어졌다. 신재민 트릴리온랩스 대표는 "AGI(인공일반지능)를 만들어 나가는 연구소라는 뜻으로 '랩스'라는 이름을 넣었다"라며 "앞으로 계속 새로운 기술을 만들어낼 것"이라고 밝혔다. 실제로 현재 직원의 70%가 연구원이라는 점에서 이 회사의 정체성이 명확히 드러난다.
과거 네이버 하이퍼클로버X 개발 핵심 연구원으로 일한 신 대표는 AI 전문성을 익힌 후 보다 직접적으로 LLM을 개발하고자 하는 목표로 창업에 뛰어들었다. AI 업계가 너무 빠르게 변화하는 가운데 스타트업 같은 기민한 조직을 통해 더 나은 성과를 낼 수 있을 것이라는 판단이었다. 실제로 그는 "AI 업계는 하루에 논문이 100개씩 나올 정도로 빠르게 변화하고 있다"며, "어제 했던 게 오늘 쓸모없어질 수도 있는데, 그만큼 시장 변화에 빠르게 대응하려면 기민한 조직으로 가서 새로운 시도를 하고 싶었다"라고 창업의 계기를 설명했다.
신 대표는 오픈AI, 앤트로픽, 네이버 등 대형 기업이 주도하는 LLM 시장 속에서도 스타트업이 충분히 경쟁력을 발휘할 수 있다고 강조했다. 그는 “향후 LLM 시장은 하나의 모델만 살아남기보다는 적어도 두세 개, 많게는 수십 개의 모델 회사가 공존할 것”이라며 “그중 하나를 우리가 만들고 싶다”라고 말했다.
오픈소스 AI로 투명성 증명
현재 많은 AI 스타트업이나 기술 기업이 외부 모델을 이용해 서비스형 AI나 콘텐츠 기업을 만들고 있다. 하지만 신재민 대표는 극소수만 할 수 있는 근본 기술 개발을 선택했다. 그는 "타사의 AI를 활용하는 회사가 아니라 진짜 AI를 만드는 회사가 되고 싶었고, 실제로 그럴 수 있는 역량이 있다고 보았다"고 소개했다. 이처럼 독자적인 LLM을 개발하는 전략은 최근 한국에서 주목받는 소버린 AI 기조와도 맞닿아 있다.
신재민 대표는 소버린 AI가 단순히 한국어를 잘하는 모델을 의미하는 것이 아니라, AI를 직접 만들 수 있는 원천 기술을 국가가 보유하는 것 자체가 진짜 핵심이라고 강조했다. 그는 소버린 AI를 "방산 산업과 비슷하다"고 비유하며, 위험은 있지만 성공했을 때 얻는 이익이 매우 크고 원천 기술을 확보하는 것이 국가 경쟁력의 핵심 동력이라고 설명했다. 또한 그는 "국가 주권형이라는 단어가 거창하게 들리지만, 사실은 '한국 기업이 직접 AI 기술을 만들 수 있는 역량을 갖추는 것'이 가장 중요하다"라며, 소버린 AI의 목적은 결국 한국어 모델이 아니라 글로벌 경쟁에서 더 뛰어난 AI 모델을 만드는 것이라고 말했다.
현재 트릴리온랩스의 대표 기술은 트리(Tri) 시리즈의 언어모델로 Tri-7B(70억개 파라미터), 21B(210억개 파라미터), 70B(700억개 파라미터)의 풀스택 3종을 완성했다. 신 대표는 적은 데이터와 비용으로도 대규모 언어모델을 안정적으로 학습시키는 고난도 기술력을 보유해, 동일한 자원 대비 더 높은 성능을 구현할 수 있음을 이미 입증했다고 밝혔다.
트릴리온랩스가 추구하는 가장 큰 기술적 목표는 ‘더 큰 LLM을 직접 만드는 능력’을 확보하는 것이다. 작은 모델을 쪼개는 것은 비교적 쉬운 기술이지만, 작은 모델을 대형 모델로 키우는 일은 완전히 다른 차원의 난도를 요구한다. 신재민 대표는 이를 반도체 공정에 비유하며 “작은 모델을 크게 만드는 기술력은 사실상 극소수의 기업만 보유한 3나노·2나노급 공정 기술과 같다”라고 설명한다. 대규모 GPU 수천 장을 하나의 컴퓨터처럼 안정적으로 묶어 학습시키는 과정은 하드웨어 장애, 데이터센터 이슈, 전력 문제 등 무수한 변수를 관리해야 하는 고난도의 공학 작업이며, 이를 수행할 수 있는 팀은 전 세계적으로도 드물다. 트릴리온랩스는 바로 이 고난도 공학 역량을 갖춘 몇 안 되는 팀 중 하나라는 점을 강조했다.
이때 트릴리온랩스의 차별화 포인트는 먼저 한국어 성능과 전반적 AI 성능의 균형이다. 신 대표는 "보통 한국어를 잘하게 하려면 AI 성능이 나빠지는 경향이 있다"라며 "하지만 우리는 한국어를 잘하면서도 성능이 좋은 모델을 만들었다“라고 말했다.
이는 단순히 기술적 성취를 넘어 한국 시장의 현실적 필요를 반영한 것이다. 글로벌 모델들은 한국어 성능이 상대적으로 약할 수밖에 없고, 한국어에 특화된 모델들은 전반적 성능이 떨어지는 경우가 많았다. 트릴리온랩스는 이 둘의 균형점을 찾았다.
그런 면에서 트릴리온랩스는 이미 한국을 넘어 글로벌 시장 확장을 준비하고 있다. 신 대표는 “우리가 만드는 모델을 특정 국가에 국한된 기술이라고 생각하지 않는다”라며 “한국어도 잘하면서 글로벌 무대에서도 경쟁할 수 있는 모델을 만들 것”이라고 밝혔다. 단순히 ‘한국어 특화 모델’을 넘어, 글로벌 표준 모델과 어깨를 나란히 하겠다는 의미다.
비용 대비 성과에서도 강점을 보인다. 이는 제한된 자원으로 효율적인 모델을 개발하는 스타트업의 강점이기도 하다. 최근 트릴리온랩스는 국내 최초로 700억개 파라미터 규모의 LLM모델 ‘Tri-70B’를 오픈소스로 공개했으며, Tri 시리즈(0.5B, 1.9B, 7B, 70B)의 중간 체크포인트까지 공개했다. 대규모 모델의 중간 체크포인트까지 전면 공개한 영리 기업으로서 기술 투명성과 신뢰성을 확보해, 글로벌 모델 개발사와 차별화되는 독자 경쟁력을 갖추고 있다. 여기서 말하는 AI에서 중간 체크포인트(intermediate checkpoint)는 모델 학습 과정 중 특정 시점의 모델 상태를 저장해 둔 파일을 의미한다.
[Tri 시리즈 비용 대비 성능지표 그래프]
신재민 대표에 따르면, 작은 규모의 모델에서는 사례가 일부 있었지만, 이처럼 대형 모델의 중간 체크포인트를 공개한 경우는 없었다. 그는 “중간 체크포인트 공개는 모델의 최종 결과뿐 아니라 학습이 진행되는 과정까지 외부에서 확인할 수 있도록 하는 방식”이라고 설명했다. 이를 통해 연구자나 개발자가 모델이 어떤 방식으로 개선됐는지 검토할 수 있고, 개발 과정 전반에 대한 검증 가능성도 높아진다는 것이다. 신 대표는 “이번 공개의 목적은 기술적 투명성을 강화하고, 대형 모델을 자체적으로 개발할 수 있는 역량을 보다 명확히 보여주는 데 있다”라고 덧붙였다.
트릴리온랩스가 오픈소스 전략을 택한 이유는 단순한 투명성 확보를 넘어선다. 신 대표는 “AI 모델의 오픈소스는 전통적인 오픈소스 소프트웨어보다 플랫폼적 성향이 강하다”고 설명했다. 그의 말에 따르면 전통적 오픈소스가 여러 개발자가 함께 기능을 확장하는 협업 중심 구조라면, AI의 오픈소스는 성격이 조금 다르다. 사람들이 모델 자체의 개발에 깊이 기여하기보다는, 모델을 가져가 자신들의 서비스·제품을 만드는 데 활용하는 경우가 훨씬 많기 때문이다.
즉, AI의 오픈소스는 운영체제(OS)처럼 플랫폼 역할을 수행하며, 그 위에서 다양한 애플리케이션이 만들어지는 생태계를 형성한다는 의미다. 신 대표는 앞으로 안드로이드와 같은 방식으로 여러 기업이 오픈소스 AI 모델을 기반으로 다양한 AI 제품을 구축할 수 있는 구조가 가능해질 것이라고 전망하며, 7B부터 21B까지의 Tri모델 역시 그 중심 모델 중 하나가 되기를 기대한다고 밝혔다.
오픈소스 전략은 작은 규모의 스타트업에 특히 큰 의미를 갖는다. 신 대표는 “신생 기업은 AI 모델을 오픈소스로 공개함으로써 기술력에 대한 외부의 의심을 걷어낼 수 있다”며, 학습 과정과 모델 구조를 그대로 드러내는 방식으로 어떻게 모델을 만들었는지, 그리고 그 품질과 독자성을 업계에 투명하게 입증할 수 있다고 강조했다.
앞으로 트릴리온랩스는 소수 정예의 전문 조직으로서 기술력을 지속적으로 고도화하는 동시에, 외부 기업의 AI 전환을 지원하는 역할까지 확대해 나갈 계획이다. 신 대표는 AI 기업과 기존 IT 기업의 협력 구조를 수영 선수와 마라톤 선수의 관계로 설명했다. 그는 “AI 도입은 챗GPT를 쓰는 것만으로도 절반은 되지만, 진짜 어려운 것은 직접 AI를 만드는 단계로 전환하는 일”이라며 “수영과 마라톤이 모두 엘리트 종목이지만 전혀 다른 기술을 요구하듯, AI 전환은 두 전문성을 결합해야 하는 복합 종목과 같다. 그래서 AI를 잘 아는 파트너가 반드시 필요하다”고 설명했다.
댓글 0
댓글 작성
댓글을 작성하려면 게시글 작성 시 입력한 이메일과 패스워드를 입력해주세요.