2025.08.26
K-AI 생태계, 오픈소스로 열다
- Open UP -
국내 AI 기술 주권 확보를 위한 K-AI 파운데이션 모델 개발 사업 본격화, 5개 팀(네이버클라우드, LG AI연구원, SK텔레콤, NC AI, 업스테이지) 선정
프롬 스크래치 방식으로 개발된 AI 모델의 오픈소스 공개 전략 제시, 국내 AI 생태계 확장성과 접근성을 동시에 확보 가능
기존 언어 모델을 넘어 멀티모달 모델이나 옴니 파운데이션 모델 등 자체 기술력 기반의 고도화 및 글로벌 수준의 AI 모델이 목표
오픈소스 전략으로 시작하는 K-AI 프로젝트, 국내 AI 기술 독립 및 성장 가속화
국내 AI 기술 주권 확보를 위한 K-AI 파운데이션 모델 개발 사업 본격화, 5개 팀(네이버클라우드, LG AI연구원, SK텔레콤, NC AI, 업스테이지) 선정
최종 선정된 팀들은 프롬 스크래치(처음부터 개발) 방식으로 개발된 AI 모델을 오픈소스로 공개하는 전략 제시, 이는 국내 AI 생태계 확장성과 접근성을 동시에 확보할 수 있을 것으로 기대
5개 선정팀 모두 다른 기업이 파생형 모델을 개발 가능한 수준으로 공개하는 높은 수준의 오픈소스 정책을 제시
또한, 기존 언어 모델을 넘어 멀티모달 모델이나 옴니 파운데이션 모델 등 자체 기술력 기반의 고도화 및 글로벌 수준의 AI 모델을 목표로 함
옴니(Omni) 파운데이션 모델 : 이종 데이터의 통합 이해 및 생성 등이 가능한 단일 모델
K-AI 기업별 주요 오픈소스 AI 모델, 글로벌 경쟁력 입증
K-AI 기업의 오픈소스 모델들은 수만~수십만 다운로드를 기록하는 등 AI 성능과 가능성을 증명하며 글로벌 개방형 AI 생태계 일원으로 발돋움 중
네이버클라우드 – 하이퍼클로바(HyperCLOVA)X 시드 시리즈
텍스트와 이미지를 모두 이해하고 텍스트를 생성하는 비전-언어 모델 ‘하이퍼클로바X 시드 비전 3B('25.4)’, 텍스트 기반 언어 모델 ‘하이퍼클로바X 시드 텍스트 1.5B, 0.5B('25.4)’, 추론 모델 ‘하이퍼클로바X 시드 14B 씽크('25.6)’ 등 허깅페이스에 공개
하이퍼클로바X 시드 씽크 14B는 공개 2주 만에 3만 다운로드 기록, 하이퍼클로바X 시드 비전 3B는 최근 한 달간 60만, 누적 131만 이상 다운로드 기록
텍스트·이미지·오디오·비디오 등 다중 데이터를 통합적으로 이해하고 생성하는 옴니 파운데이션 모델 개발 계획
(목표) 실시간 AI 서비스 플랫폼과 ‘AI 에이전트 마켓플레이스’를 구축하여 누구나 AI 에이전트를 개발하고 유통할 수 있는 개방형 생태계를 지향
업스테이지 – 솔라(Solar) 시리즈
대규모 언어 모델 ‘솔라 10.7B('23.12)’, 단일 GPU에 맞춰 설계된 모델 ‘솔라 프로 프리뷰('24.9)’ 등 오픈소스로 공개
공개된 모델은 누적 200만 다운로드 기록 중
차세대 추론 AI 모델 솔라 프로 2는 글로벌 AI 분석 기관 '아티피셜 애널리시스' 지능 지표에서 58점을 받으며 전체 12위 기록하여 국내 모델 중 유일하게 10대 개발사 중 하나로 이름을 올림
멀티모달을 기반으로 한 자체 학습 알고리즘을 새롭게 설계 예정
(목표) 법률, 제조, 국방, 금융 등 산업별 맞춤형 활용에 중점을 두고 AI 산업의 실질적 전환을 이끄는 것과 동시에 3년 내 1,000만 사용자를 확보하는 대국민 서비스도 병행 예정
LG AI연구원 – 엑사원(EXAONE) 시리즈
국내 최초로 공개한 언어 모델 ‘엑사원 3.0('24.8), 엑사원 3.5('24.12)’, 추론 특화 모델 ‘엑사원 딥('25.3)’, 언어 생성·추론 하이브리드 모델 ‘엑사원 4.0('25.7)’, 병리 이미지 분석 모델 ‘엑사원 패스 2.0('25.7)’ 등 허깅페이스에 공개
엑사원 3.5, 엑사원 딥과 엑사원 4.0, 엑사원 패스 2.0은 미국 비영리 AI 연구기관 에포크(Epoch) AI의 ‘주목할 만한 AI 모델’에 선정
엑사원 4.0 32B 모델은 허깅페이스에서 공개 후 3주 만에 55만 다운로드, 파생 모델 33개, 경량화 모델 1.2B도 2만 다운로드, 파생 28개를 기록
엑사원 4.0의 기술력을 기반으로 시각·자연어·행동 데이터를 통합하는 멀티모달 파운데이션 모델을 개발 계획
(목표) 전 분야에 걸쳐 다양한 AI 서비스 사례를 창출하고, 누구나 쉽게 접근할 수 있는 풀스택 AI 생태계 조성
NC AI – 바르코 비전 2.0(멀티모달)
한국어 기반 멀티모달 AI ‘바르코 비전 2.0’ 4종('25.7) 오픈소스로 공개
오픈소스 바르코 비전 2.0 14B 모델은 국내 멀티모달 모델 중 최초로 세계 최고 수준급(SOTA) 성능 기록
게임 캐릭터의 대사를 자동으로 생성하고 영상의 문맥을 읽는 게임 특화 멀티모달 모델
모델 공개 후 3주 만에 1만 다운로드 기록
바르코 시리즈를 고도화하고 멀티모달 인지 생성 기술을 개발 예정
(목표) 제조·유통·로봇 등 40개 수요기업과 연계해 산업 맞춤형 전환(AX)을 지원할 수 있는 ‘도메인옵스’ 체계를 구축하고, 허깅페이스를 통해 모델을 공개하여 생태계 확장을 도모
SK텔레콤 – A.X 3.1 및 A.X 4.0 시리즈
독자 개발한 대규모 언어 모델 ‘A.X 3.1’, 경량 언어 모델 ‘A.X 3.1 라이트’, Qwen2.5 기반의 한국어 특화 언어 모델 ‘A.X 4.0’, 한국어 데이터셋을 학습한 멀티모달 모델 ‘A.X 4.0 VL Light’, 독자 개발한 한국어 특화 문서 이해 모델 ‘A.X Encoder’('25.7) 등을 오픈소스로 공개
한국어 문장을 입력했을 때 GPT-4o보다 A.X 4.0이 약 33%가량 높은 토큰 효율을 기록
A.X 4.0 라이트는 출시 2주 만에 4만5천 다운로드, 파생 모델 18개 기록
반도체부터 모델, 데이터, 서비스까지 아우르는 풀스택 오픈 전략을 통해 국내 생태계를 주도하려는 의지를 보이고 있음
(목표) 제조·게임·로봇 등 다양한 산업 분야에서 AI 확산을 추진하면서 국민 접근성과 산업 활용성을 동시에 강화
시사점
오픈소스 AI 전략은 단순한 기술 공개를 통한 단기적 성과를 넘어, K-AI 프로젝트 전체의 기술 자립과 국내 AI 생태계 활성화를 통해 글로벌 경쟁력 확보에도 긍정적 역할을 할 것
공개된 모델을 활용해 중소기업과 스타트업 등이 빠르게 시장에 진입하고, 혁신적인 서비스를 개발할 수 있는 환경이 조성될 것으로 기대
오픈소스 AI 전략은 특정 기업에 국한되지 않고 다양한 산업 전반에서 AI 혁신을 가속화하는 기반이 될 것이며, 연구자·학생·스타트업 등 다양한 주체에게 AI 개발 참여 기회를 넓혀 국내의 AI 인재 양성에 크게 기여할 것
K-AI 프로젝트의 신뢰와 참여, 지속가능성을 갖춘 성공적 확산을 위해, 리눅스 재단의 MOF(Model Openness Framework)*와 같이 개방 수준을 명확히 구분하는 등급 체계에 기반한 오픈소스 AI 전략 마련이 필요
MOF는 AI 모델의 완전성과 개방성을 객관적으로 평가·등급화하는 표준 체계로, AI 모델의 17개 핵심 구성 요소와 적절한 오픈 라이선스로 제공했는지 평가해 Class I, II, III 등급으로 분류
주목할 만한 월간 이슈(8월)
(AI) 오픈AI, AI 모델 2종 6년 만에 오픈 모델로 개방
오픈AI, 오픈웨이트(가중치 공개) 언어모델인 gpt-oss-120b와 gpt-oss-20b를 아파치 2.0 라이선스로 허깅페이스를 통해 출시
오픈웨이트는 기존 오픈소스 소프트웨어(SW)와 달리 AI가 학습을 통해 얻은 내부 가중치는 공개하되 모델 구조나 데이터 및 소스코드 등은 비공개하는 방식
gpt-oss-120b 모델은 핵심 추론 벤치마크에서 기존 o4-미니 모델과 동급의 성능을 보이며, 단일 80GB GPU에서 효율적으로 작동
gpt-oss-20b 모델은 일반 벤치마크에서 기존 o3-미니 모델과 유사하며, 여러 기기에 단 16GB 메모리만 있어도 구동 가능
이 모델들은 과학·기술·공학·수학(STEM), 코딩, 일반지식 중심으로 대부분 영어로 된 고품질 텍스트 전용 데이터세트로 훈련되었으며, 효율적인 처리를 위해 전문가혼합(MoE) 방식도 적용
한편, 오픈AI의 소형 모델 ‘gpt-oss-20B’는 최근 외부 연구자*에 의해 수정, ‘gpt-oss-20b-base’라는 버전으로 공개됨
코넬 공과대학교 박사 과정생이자 메타 연구원인 잭 모리스가 13일(현지시간) 공개
오픈AI가 추가한 ‘추론’ 기능을 제거하고, 원래의 사전학습(base) 상태에 가깝게 되돌린 것이 특징인 gpt-oss-20b-base는 MIT 라이선스로 허깅페이스에 공개돼, 연구와 상업적 활용이 가능
(AI) NASA, 지구 관측 데이터 종합 분석 모델 '갈릴레오' 오픈소스 출시
NASA 하베스트와 앨런 AI 연구소(Ai2) 등은 지구 관측 데이터를 종합 분석할 수 있는 오픈소스 AI 모델 ‘갈릴레오(Galileo)’ 공개
광학 위성 이미지부터 레이더, 고도, 기후, 인구 밀도 지도 등 다양한 데이터를 통합해 농업 모니터링, 재난 대응, 환경 관측 등 핵심 분야에 활용될 수 있는 범용 모델
최근 온라인 아카이브를 통해 다양한 지구 관측 데이터 스트림을 대규모로 처리, 분석, 이해하기 위해 개발한 차세대 멀티모달 파운데이션 모델 ‘갈릴레오‘에 관한 논문을 발표
갈릴레오는 다양한 스케일과 데이터 유형에 걸쳐 패턴을 인식함으로써, 지구에서 벌어지는 일을 전체적으로 이해할 수 있는 통찰을 제공하여 농업용 토지 지도 작성, 홍수 감지, 해양 오염 모니터링 등 다양한 과제를 하나의 모델로 해결 가능
갈릴레오는 '센티넬-1(Sentinel-1)'과 '센티넬-2' 위성의 광학과 SAR 데이터, NASA 'SRTM'의 고도 데이터, 'ERA5' 기후 데이터, 'VIIRS' 야간조도, 인구 및 토지 지도 등 총 9가지 유형의 데이터를 융합
갈릴레오는 코드, 사전학습 모델, 데이터셋을 모두 깃허브에 공개, 전 세계 지구 관측 커뮤니티의 채택과 확장을 지원
허깅페이스 자료에 따르면, 7월 25일 현재 미국 오픈소스 모델의 올해 다운로드는 2억 7,300만건이며, 중국은 2억 4,900만건을 기록
최근 미국에서는 중국의 오픈 소스에 맞서자는 움직임이 일고 있는데, 트럼프 행정부의 AI 실행 계획에는 오픈소스가 주축이 돼야 한다는 내용이 포함되었으며, 들랑그 허깅페이스 CEO도 이를 촉구하자고 주장
(로봇) Ai2, '3D로 추론하는' 로봇 팔 AI 모델 오픈소스 출시
앨런 AI 연구소(Ai2)는 카메라와 센서로 인식한 3D 환경을 토대로 로봇의 동작 경로를 사전에 설계한 뒤 실행하는 새로운 행동 추론 모델(ARM) ‘몰모액트 7B(MolmoAct 7B)’를 오픈소스로 공개
기존 시중 로봇 모델이 ‘비전-언어-행동(VLA)’ 방식으로 동작하는 것과 달리, ARM은 고수준의 자연어 명령을 해석한 뒤, 이를 시각적으로 인지한 환경을 반영해 실제 물리적 행동 계획으로 세분화해 실행
기존 VLA의 텍스트 토큰과 달리, 3D 공간을 이해하기 위해 공간 정보를 포함하는 ‘공간 기반 인식 토큰(spatially grounded perception tokens)’을 활용
Ai2는 로봇 팔부터 휴머노이드까지 최소한의 미세조정만이 필요하다고 밝힘
엔비디아의 'GR00T-N2-2B'는 6억개 샘플을 H100 1024개로 학습, 피지컬 인텔리전스의 '파이-제로(pi-zero)'는 9억개 샘플과 비공개 수량의 칩을 사용, 반면 몰모액트 7B는 샘플 1800만개를 'H100' GPU 256개로 학습, 사전 학습은 하루 만에 완료
누구나 미세조정하거나, 바로 사용해 볼 수 있도록 몰모액트 모델과 학습 데이터를 허깅페이스에 공개
(오픈소스 프로젝트) ATOM 프로젝트, 오픈소스 모델에 전념하는 미국 AI 연구소 설립을 추진
AI 연구원 네이선 램버트가 주도하는 ATOM(American Truly Open Models) 프로젝트는 오픈AI와 엔비디아 등 미국의 주요 기업 관계자들과 함께 중국의 오픈소스 AI 공세에 대응, 연합 프로젝트를 출범
네이선 램버트는 구글 딥마인드와 메타, 허깅페이스 등에서 핵심 AI 연구원으로 활동
제이슨 권 오픈AI 최고 전략책임자와 올렉시 쿠차이예프 엔비디아 응용 연구 책임자, 클레망 들랑그 허깅페이스 CEO, 알리 파르하디 앨런 AI연구소 CEO, 딜런 파텔 세미애널리시스 CEO, 크리스 매닝 스탠포드대학교 교수 등 20여명등이 지지 서명
ATOM은 현재 추세라면 두어달 뒤에는 중국이 허깅페이스 모델 다운로드에서 미국을 앞지를 것으로 예측, 중국으로부터 오픈소스 AI 기술 분야의 선두를 미국이 되찾는 것이 목표
※ 참고 Reference
K-AI 기업, 오픈소스 모델도 글로벌 경쟁력 입증, 전자신문, 2025.08.06.
https://www.etnews.com/20250806000224
한국 정부, K-AI 모델 개발 시동···정예팀 5곳와 함께하는 50여 개 기관은 어디?, CIO Korea, 2025.08.05.
https://www.cio.com/article/4034059/...
[종합] "K-AI 청사진, 프롬 스크래치와 오픈소스"…정부, 독자 AI 개발 속도, 뉴스핌, 2025.08.04.
https://www.newspim.com/news/view/20250804000906
국가대표 AI 정예팀 공통점은?...독자 AI·오픈소스·도전·생태계 기여, 디지털투데이, 2025.08.04.
https://www.digitaltoday.co.kr/news/articleView.html?idxno=582524
독자 AI 특화 공통점에 오픈소스 제시 ‘가산점’, 국민일보, 2025.08.05.
https://www.kmib.co.kr/article/view.asp?arcid=1754297040
한국도 오픈소스 개방 경쟁…‘AI 헤게모니’ 춘추전국시대, 에너지경제, 2025.07.23.
https://m.ekn.kr/view.php?key=20250723027439644
오픈AI, AI 모델 2종 오픈소스 공개…6년 만에 개방, 전자신문, 2025.08.06.
https://www.etnews.com/20250806000007
오픈AI, 오픈웨이트 모델 ‘gpt-oss’ 2종 출시, 디지털타임스, 2025.08.06.
https://www.aitimes.com/news/articleView.html?idxno=200332
오픈AI 첫 오픈 모델 ‘gpt-oss’, 연구자에 의해 추론·안전 장치 제거, AI타임스, 2025.08.19.
https://www.aitimes.com/news/articleView.html?idxno=201590
NASA, 지구 관측 데이터 종합 분석 모델 '갈릴레오' 오픈 소스 출시, AI타임스, 2025.08.10.
https://www.aitimes.com/news/articleView.html?idxno=201264
중국 오픈 소스 저지 위한 미국 연구소 프로젝트 출범...오픈AI·엔비디아 등 지지, AI타임스, 2025.08.06.
https://www.aitimes.com/news/articleView.html?idxno=201285
Ai2, '3D로 추론하는' 로봇 팔 AI 모델 오픈소스 출시, AI타임스, 2025.08.14.
https://www.aitimes.com/news/articleView.html?idxno=201518
허깅페이스, 휴머노이드형 동반자 로봇 '리치 미니' 판매 시작, 로봇신문, 2025.07.09.
https://www.irobotnews.com/news/articleView.html?idxno=41136
허깅페이스, 개발자용 오픈소스 데스크톱 로봇 ‘리치 미니’ 출시... AI 개발 혁신 예고, 테크브루, 2025.07.09.
https://techbrew.co.kr/news/?bmode=view&idx=166665940
BC카드가 대형언어모델을 오픈소스로?....금융사 최초 양자화 모델 18종 허깅페이스에 공개, "중저가 GPU서 구동", 인공지능신문, 2025.07.09.
https://www.aitimes.kr/news/articleView.html?idxno=35591
'감성 지능' 개발 위한 오픈소스 모델·도구 출시..."주요 AI 기업 이미 적용 중", AI타임스, 2025.06.27.
https://www.aitimes.com/news/articleView.html?idxno=200153
댓글 0
댓글 작성
댓글을 작성하려면 게시글 작성 시 입력한 이메일과 패스워드를 입력해주세요.