2025.05.27
국내 주요 기업의 오픈소스 LLM 공개 현황 분석
- Open UP -
챗GPT 등장 이후 국내 기업들도 오픈소스 LLM 공개 확산
업스테이지는 LLM 모델 SOLAR 10.7B를 Apache 2.0 라이선스로 공개
SOLAR 10.7B는 업스테이지가 개발한 Depth Up-Scaling(DUS)** 기법을 통해 효율적으로 확장
마음AI는 Llama3 8B 모델을 한국어 성능 강화한 Llama3 MAAL-Hummingbird를 공개하고 연세대학교 미르랩과 공동으로 개발한 VLA모델인 ‘CANVAS’를 CC-BY-NC 4.0 라이선스로 공개
CANVAS 모델은 인공지능 학회인 신경정보처리 시스템학회 NeurIPS 2024 워크숍에서 최우수 발표 논문으로 선정되어 기술력을 인정받음
LG AI연구원은 자체 개발한 LLM 모델 '엑사원(EXAONE) 3.0'을 시작으로 활용 목적에 맞춰 규모에 따라 3가지로 나뉜 엑사원 3.5, 고성능 추론 AI 모델인 엑사원 Deep 시리즈를 연구 목적으로 활용할 수 있도록 공개
'엑사원 딥-32B'는 미국의 비영리 AI 연구기관인 에포크 AI가 선정하는 주목할 만한 AI 모델 리스트에 등재되며 기술 경쟁력을 인정받음
카카오는 연구자와 개발자들의 AI 기술의 접근성을 높이고자 자체 개발 언어모델인 연구목적을 위한 '카나나 나노 2.1B' 모델(CC-BY-NC 4.0)과 상업적 활용이 가능한 '카나나 1.5' 모델(Apache 2.0)을 차례로 공개
카나나 테크니컬 리포트를 통해 카나나 언어모델 매개변수와 학습 방법, 학습 데이터 등 세부 사항 및 카나나 모델의 구조, 학습 전략, 그리고 글로벌 벤치마크에서의 성과 등 사전학습부터 사후 학습까지의 전 과정을 공개
네이버는 하이퍼클로바 X 기반의 경량 오픈소스 LLM 모델 ‘하이퍼클로바 X-SEED’를 상업적 활용이 가능하도록 공개
중소규모 비즈니스를 중심으로 국내 AI 생태계 활성화를 위해 공개하였으며, 한국어와 한국 문화 이해에 탁월한 명령어 추종 기능을 갖춤
챗GPT 등장 이후 국내에서도 오픈소스 LLM 공개 증가, 국내 주요 기업들은 한국어 특화 및 경량화 모델을 중심으로 자체 기술을 공개하고 다양한 산업 분야로 활용을 확대 중
챗GPT 확산 이후 전 세계적으로 오픈소스 LLM의 공개가 활발해짐에 따라 국내 기업들도 오픈소스 LLM 모델의 공개 사례도 증가하고 있음
2022년 챗GPT 서비스를 공개 이후 스태빌리티 AI의 Stable Diffusion(2022~), 메타의 LLaMA(2023~), 미스트랄 AI의 Mixtral(2023~) 등이 개방형 모델들을 공개하기 시작하였고 중국 스타트업 딥시크가 DeepSeek-R1 모델(‘25~)을 공개하면서 생성형 AI 기술에 대한 글로벌 경쟁은 더욱 심화
업스테이지는 2023년 12월 LLM 모델인 SOLAR 10.7B를 Apache 2.0 라이선스로 공개하였으며, 태국, 베트남 등 동남아시아, 일본, 미국 등으로 사업 확장 중으로, CB Insights의 ‘2025년 가장 혁신적인 AI 스타트업 100’에 선정
SOLAR 10.7B는 107억 개의 매개변수를 가진 고급 대규모 언어 모델(LLM)로 업스테이지가 개발한 Depth Up-Scaling(DUS)** 기법을 통해 효율적으로 확장
DUS는 오픈소스로 공개된 사전학습 모델을 쉽고 효과적으로 합쳐 모델 크기를 키울 수 있는 획기적인 기법
공개 직후 허깅페이스의 Open LLM 리더보드에서 평균 점수 74.2를 기록하며 1위를 차지하기도 함
노코드 LLM 평가 플랫폼 ‘이벨버스(Evalverse)’를 개발, 다양한 벤치마크를 통해 LLM의 성능 통합 평가 가능하도록 오픈소스(Apache-2.0)로 공개
AWS와 함께 교육 및 공익 분야의 AI활용 확대를 지원하는 ‘AI 이니셔티브’를 시작하였으며, 최근 일본의 카라쿠리(Karakuri), 휴직(Fusic)과 전략적 파트너십을 맺으며 일본 시장에도 진출
현재 태국 IT 전문 기업 자스민 테크놀로지 솔루션(JTS)에 태국어 특화 LLM 구축 등 동남아 시장으로 확대 중
마음AI는 글로벌 AI 기술을 한국어와 실세계 환경에 맞게 커스터마이징하여 Llama3 MAAL-Hummingbird 공개
메타의 Llama3 8B 모델을 한국어 성능 강화를 위해 외국어로서 한국어를 가르치는 방식의 교차언어 훈련(Cross-Lingual training)을 통해 개발한 모델의 체크포인트를 허깅페이스에 공개
2024년, 연세대학교 미르랩과 공동으로 연구한 논문을 통해 자율주행 로봇 제어에 특화된 종단 간 로봇 파운데이션 모델을 선보였으며, 이를 토대로 개발한 VLA(Vision-Language-Action) 모델인 ‘CANVAS’를 CC-BY-NC 4.0 라이선스로 공개
인공지능 학회인 신경정보처리시스템학회NeurIPS 2024 워크숍에서 최우수 발표 논문으로 선정되어 기술력 인정받은 CANVAS 모델은 생성형 AI 기술을 기반으로 시각적·언어적 정보를 통합하여 물리적 행동을 유도하는 구조를 갖추고 있으며, 명령을 이해해 실제 로봇이나 이동형 장비를 제어하는 데 활용
‘AI 엑스포 2025’에서 실제 공간에서 작동하는 피지컬 AI 기술을 중심으로 상용화 전략을 제시하고 다양한 산업 적용 사례를 공개하고 공공서비스를 넘어 국방 분야로의 확장 계획까지 발표
오픈소스 기반 기술과 자체 개발 모델을 활용하여 실제 로봇·디바이스에 AI 구동을 위한 LLM 모델의 경량화 등 온디바이스 AI 기술, 시뮬레이터, AI 에이전트 등 적용 기술 설명과 실제 상용화 및 디바이스 탑재에 성공한 자율주행 농기계, 병원 로봇, 국방 로봇 등 다양한 산업군으로 사업화 사례 등 발표
마음AI 대표는 “피지컬 AI는 단순한 기술 구현을 넘어, 실제 산업과 안보 현장에서 유효 수요를 창출하는 전략적 AI 기술로 소재·부품·장비 산업 등 침체된 산업 생태계를 다시 움직이고, 국가 경쟁력 회복에 기여할 수 있는 핵심 기반”이라고 강조
LG AI연구원은 2024년 8월 자체 개발한 LLM 모델 '엑사원(EXAONE) 3.0'을 시작으로 후속모델을 단계적으로 공개하며 개방형 AI 연구 생태계 기반 마련
AI 연구 생태계 발전 기여를 위해 경량 모델을 연구 목적으로 활용할 수 있도록 오픈소스로 공개하고 LG 계열사 제품과 서비스에 적용하여 산업 현장에서 활용
활용 목적에 맞춰 효율적으로 사용할 수 있도록 공개한 엑사원 3.5는 온디바이스용 초경량 모델(2.4B), 범용 목적의 경량 모델(7.8B), 고성능 모델(32B) 등 3종 공개, 실제 사용성, 장문 처리 능력, 코딩, 수학 등에서 세계 최고 수준의 성능 달성
2025년 3월, 수학, 과학, 코딩 등 전문 분야에 특화된 고성능 추론 AI* 모델인 엑사원 Deep 시리즈**를 공개, 특히 ‘엑사원 딥-32B’는 미국의 비영리 AI 연구기관인 에포크(Epoch) AI가 선정하는 주목할 만한 AI 모델(Notable AI Models) 리스트에 등재되며 기술 경쟁력을 인정받음
추론 AI는 ‘사고의 흐름(chain-of-thought)’ 기반 추론을 가능케 하여 복잡한 문제를 단계적으로 분석하고 해법을 도출하는 능력을 갖춘 논리형 인공지능
32B 모델은 한국어에 강점이 있는 엑사원 파운데이션 모델을 기반으로 하였으며 수능 수학 영역 94.5점, MATH-500 테스트 95.7점 등 수학과 과학 문제 해결 능력에서 우수성 입증
‘엑사원 딥-7.8B’은 경량 모델로 미국 오픈AI의 o1-mini의 성능을 상회하였으며, ‘엑사원 딥-2.4B’은 온디바이스용 초경량 모델로 외부 서버와의 연결 없이 기기 내부에서 안전하게 데이터를 처리해 보안성과 개인정보 보호 측면에서 강점
카카오는 2025년 2월, 자체 개발 언어모델 ‘카나나(Kanana)’의 연구성과를 담은 ‘카나나 테크니컬 리포트’를 공개하고 ‘카나나 나노 2.1B’ 모델을 CC-BY-NC 4.0 라이선스로 공개
테크니컬 리포트를 통해 카나나 언어모델 전체의 사전학습부터 사후 학습까지의 전 과정을 공개 즉, 매개변수와 학습 방법, 학습 데이터 등 세부 사항 및 카나나 모델의 구조, 학습 전략, 그리고 글로벌 벤치마크에서의 성과 등 확인 가능
‘카나나 나노 2.1B’는 연구자와 개발자가 활용하기 적절한 크기의 모델이자 온디바이스 환경에서도 활용 가능한 고성능의 경량 모델로 한국어와 영어 처리 능력에서 뛰어난 결과를 보임
‘카나나 나노 2.1B’ 3종은 총 1만5000여 다운로드(25.05.15 기준)
2025년 5월, 자체 개발한 ‘카나나 1.5’ 8B와 2.1B 크기의 모델을 자유로운 수정과 상업적 활용이 가능한 Apache 2.0 라이선스로 추가 공개
이번에 공개한 모델은 △카나나-1.5-8b-베이스 △카나나-1.5-8b-인스트럭트 △카나나-1.5-2.1b-베이스 △카나나-1.5-2.1b-인스트럭트로 총 4종
기존 모델에서 업그레이드를 거친 카나나 1.5는 에이전틱 AI 구현을 위한 기능 강화에 중점
글로벌 모델 대비 뛰어난 한국어 성능을 유지하였으며, 코딩과 수학 문제 해결, 펑션 콜링 능력에서 이전 대비 평균 1.5배의 성능 향상을 기록
긴 문맥에 대한 이해와, 간결한 답변을 통해 향상된 사용성을 제공하여 정확도와 응답 길이를 최적화한 답변으로 서비스 환경에서 사용자 체감 성능을 높임
카카오는 이번 오픈소스 공개로 국내 LLM 생태계 활성화를 위한 시도와 기여를 꾸준히 이어갈 계획으로 AI 연구자와 개발자는 물론 기업이 목적에 맞게 모델을 자유롭게 튜닝하고 활용할 수 있도록 상업적 사용가능한 라이선스를 적용
오픈소스 공개를 통해 AI 기술의 접근성을 높여 연구자와 개발자들이 해당 모델을 토대로 다양한 응용을 시도할 수 있도록 모델의 업데이트를 지속 지원할 계획
네이버는 2024년 4월, 하이퍼클로바 X 기반의 경량 오픈소스 LLM 모델인 ‘하이퍼클로바 X-SEED’를 상업적 활용이 가능하도록 공개
한국어와 문화 이해에 탁월한 명령어 추종 기능을 갖추어 유사한 규모의 모델과 비교했을 때, 한국어 능력 및 수학적 성능 향상
상업적 활용이 가능하나 활성 사용자 수 및 경쟁 서비스 여부에 따라 제한될 수 있어 라이선스 내용 확인이 필요함
중소규모 비즈니스를 중심으로 국내 AI 생태계 활성화에 기여하기 위해 공개한 모델로 3B, 1.5B, 0.5B 파라미터를 가진 세 가지 모델을 공개
3B 모델은 한국어와 국내 문화에 특화된 멀티모달 모델로 텍스트와 이미지를 함께 이해할 수 있는 LLaVA** 오픈소스 프레임워크를 기반의 Vision-Language 모델임
하이퍼클로바X 시드 '3B' 모델은 약 26만 7천 회 다운로드(25.05.26 기준)
LLaVA(Large Language and Vision Assistant)는 위스콘신-매디슨 대학교, 마이크로소프트 리서치, 컬럼비아 대학교의 전문가들이 공동 개발한 오픈소스 시각-언어 통합 AI 모델
1.5B 모델은 텍스트 이해 및 생성 모델로 최대 16,000 토큰의 컨텍스트 길이를 지원하며 한국어 및 문화 관련 주요 벤치마크에서 경쟁력 있는 성능을 입증
0.5B 모델은 온디바이스 AI에 최적화된 모델로 엣지 디바이스와 같이 리소스가 제한된 환경에 배포하기에 적합한 경량 솔루션을 제공
허깅페이스에 각 모델에 대한 FAQ 를 제공하여 실행 환경 요구사항 및 모델 구성 및 사용 사례 등 추가 정보 제공
[국내 기업의 오픈소스 LLM 현황]
(기업명 가나다 순)
| 구분 | 네이버 | 마음AI | 업스테이지 | |
|---|---|---|---|---|
| 모델명 | HyperCLOVA X SEED | Llama3 MAAL-Hummingbird | CANVAS | SOLAR 10.7B |
| 라이선스 | (커스텀 라이선스) HyperCLOVA X SEED Model License | Llama 3 Community License | Creative Commons Attribution Non Commercial 4.0 (CC-BY-NC4.0) | Apache 2.0 |
| 상업적 사용 | 제한적 가능 (서비스의 월간 활성사용자가 1천만명을 초과하거나, NAVER에서 제공하는 제품/서비스와 유사하거나 직접 경쟁하는 제품/서비스를 제공하는 경우, 라이선스 사용자는 NAVER에 라이선스를 요청) | 제한적 가능 (경쟁모델 개선금지, 사용 목적 제한, 재배포시요구사항, 월간 활성사용자수가 7억명을 초과하는 서비스의 경우, Meta로부터 별도의 라이선스 취득 필요) | 불가 (비상업적 사용만 가능) | 가능 |
| 공개 범위 | 모델 가중치(weights), 모델 아키텍처, 모델 추론코드 예제 | 모델 가중치(weights), 모델 아키텍처, 모델 추론코드 예제 | 모델 가중치(weights), 모델 아키텍처 | 모델 가중치(weights), 모델 아키텍처, 모델 추론코드 예제 |
| 주요 내용 |
|
|
|
|
| 배포 링크 | [허깅페이스] | [허깅페이스] | [허깅페이스] | [허깅페이스] [깃허브] |
| 기업 | LG AI연구원 | 카카오 | ||
|---|---|---|---|---|
| 모델명 | EXAONE-3.5 | EXAONE-Deep | Kanana Nano 2.1B | Kanana 1.5 |
| 라이선스 | (커스텀 라이선스) EXAONE AI Model License 1.1 - NC | (커스텀 라이선스) EXAONE AI Model License 1.1 - NC | Creative Commons Attribution Non Commercial 4.0 (CC-BY-NC4.0) | Apache 2.0 |
| 상업적 사용 | 불가 (비상업적 연구목적에 한해 사용가능, 상업적 활용시 별도의 상업용 라이선스 계약체결 필요) | 불가 (비상업적 연구목적에 한해 사용가능, 상업적 활용시 별도의 상업용 라이선스 계약체결 필요) | 불가 (비상업적 사용만 가능) | 가능 |
| 공개 범위 | 모델 가중치(weights), 모델 아키텍처, 모델 추론코드 예제 (모델 설정 및 아키텍처 정의 python 파일은 Apache 2.0으로 공개) | 모델 가중치(weights), 모델 아키텍처, 모델 추론코드 예제 (모델 설정 및 아키텍처 정의 python 파일은 Apache 2.0으로 공개) | 모델 가중치(weights), 모델 아키텍처, 모델 추론코드 예제 | 모델 가중치(weights), 모델 아키텍처 |
| 주요 내용 |
|
|
|
|
| 배포 링크 | [허깅페이스] [깃허브] | [허깅페이스] [깃허브] | [허깅페이스] [깃허브] | [허깅페이스] [공식 arXiv 논문] |
이러한 개방형 AI 모델들은 학습된 모델 가중치, 모델 아키텍처, 추론 코드 등을 공개하고 있어 기술 접근성 및 활용에 많은 장점을 제공하나 이를 활용 시에는 각 모델에 적용된 라이선스 확인이 반드시 필요
최근 AI 모델이 적용되고 있는 라이선스는 상업적 활용, 파생 모델 생성, 데이터 재사용 등에 대해 기존의 오픈소스 소프트웨어 라이선스와는 다른 조건을 포함하고 있어 사전 검토가 필요
예시로, BLOOM 모델은 ‘BigScience BLOOM RAIL 1.0’이라는 특수 라이선스를 사용하는데 모델의 개방성을 보장하면서도 책임 있게 사용할 것을 요구하고 불법적, 차별적, 유해한 목적의 사용을 명시적으로 제한하고 있음
이후 BigScience의 철학을 기반으로 만들어진 OpenRAIL License는 개방적인 접근, 사용 및 배포를 가능하게 하는 동시에 AI의 책임 있는 사용을 요구하는 AI 전용 라이선스로 발전, Hugging Face, RAIL 이니셔티브 등이 공개 표준 주도
메타의 Llama모델 시리즈의 ‘Llama Community License’ 또한 개방형 접근 방식을 취하고 있으나 경쟁 모델 학습 금지, 월간 사용자 7억 이상 제한 등 조건이 존재
기업의 AI 커스텀 라이선스인 ‘EXAONE AI Model License 1.1–NC’나 ‘HyperCLOVA X SEED Model License’ 등도 개방형 접근 방식을 취하고 있으나 자체 제한 조건 등을 포함하고 있음
시사점
국내 기업들은 한국어 최적화 모델, 경량화 모델, 온디바이스 LLM에 초점을 맞춘 자체 개발 모델을 외부에 공개하며 기술 주도권 확보
또한, 실사용 환경에 적합한 전략을 추구, 다양한 산업 현장에서의 실제 적용 사례로 이어질 것으로 기대
오픈소스 LLM의 활용이 늘어나는 만큼, 각 모델의 라이선스 조건을 사전에 반드시 확인해야 하며, AI 특화 라이선스는 상업적 사용, 파생물 생성 등에 제약이 있을 수 있어 주의가 필요
※ 참고 Reference
업스테이지, '노코드 LLM 평가 플랫폼' 오픈소스로 전격 공개!… 글로벌 생성 AI 생태계 리딩, 인공지능 신문, 2024.04.03.
https://www.aitimes.kr/news/articleView.html?idxno=30810
업스테이지-AWS, 공익단체 및 교육기관에 'AWS AI 이니셔티브’ 통해 업스테이지 모든 AI 모델 무료 제공, 인공지능 신문, 2025.04.08.
https://www.aitimes.kr/news/articleView.html?idxno=34522
마음AI, 한국어 한계 극복한 라마기반 LLM 오픈소스 공개, 2024.04.30.
https://news.mt.co.kr/mtview.php?no=2024043014014418962
마음AI, 국내 최초 VLA 모델 'CANVAS(캔버스)' 공개...NeurIPS 2024 워크숍, 최우수 발표 논문 선정, 인공지능 신문, 2024.12.20.
https://www.aitimes.kr/news/articleView.html?idxno=33321
마음AI, ‘AI 엑스포 2025’서 피지컬 AI 기술력 입증, 로봇신문, 2025.05.15.
https://www.irobotnews.com/news/articleView.html?idxno=40017
LG AI연구원, '엑사원 3.5' 3개 모델 오픈 소스 공개..."온디바이스·프론티어급 추가", AI타임스, 2024.12.10.
https://www.aitimes.com/news/articleView.html?idxno=166087
엔비디아 무대 오른다 ‘LG AI 엑사원 딥’…오픈소스 공개·계열사 확산, 디지털데일리, 2025.03.18.
https://www.ddaily.co.kr/page/view/2025031821224885762
카카오, ‘카나나’ 경량 모델 오픈소스로 공개, IT비즈뉴스, 2025.02.28.
https://www.itbiznews.com/news/articleView.html?idxno=161279
네이버클라우드, 경량 모델 3종 오픈 소스 공개...“실제 서비스 바꾸는 AI 선보일 것”, AI타임스, 2025.04.23.
https://www.aitimes.com/news/articleView.html?idxno=169875
네이버 vs 카카오, 거대언어모델 오픈소스로 맞붙었다 … AI 생태계 확장 주력, 뉴데일리경제, 2025.05.15.
https://biz.newdaily.co.kr/site/data/html/2025/05/15/2025051500183.html
카카오, 자체 개발 언어모델 4종 오픈소스 공개…상업 라이선스 적용, 전자신문, 2025.05.23.,
https://www.etnews.com/20250523000048
네이버 하이퍼클로바X, 오픈소스 공개 한 달만에 30만 다운로드 돌파, ZDNet Korea, 2025.05.26.,
https://zdnet.co.kr/view/?no=20250526112125
[기고]생성형 AI 모델, 학습 데이터 및 생성 콘텐츠의 저작권과 라이선스 관리, 공개SW포털, 2025.05.26.
https://www.oss.kr/oss_guide/show/e26c957b-6edc-4ca3-a66a-2aabe5254230
OpenRAIL: Towards open and responsible AI licensing frameworks, Hugging Face, 2022.08.31.
https://huggingface.co/blog/open_rail
댓글 0
댓글 작성
댓글을 작성하려면 게시글 작성 시 입력한 이메일과 패스워드를 입력해주세요.